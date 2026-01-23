Il 22 gennaio 2026 segna una tappa cruciale nell’evoluzione dell’AI: il progetto open source vLLM ha ufficialmente dato vita a Inferact, una startup che ha appena raccolto 150 milioni di dollari in un seed round, portando la sua valutazione a circa 800 milioni di dollari.

Fondata a novembre 2025 dal team originario di vLLM – tra cui Simon Mo (CEO), Woosuk Kwon (CTO), Kaichao You (Chief Scientist) e altri protagonisti del progetto – Inferact parte con l’ambiziosa missione di trasformare vLLM nel motore di inferenza AI dominante a livello mondiale, abbattendo costi e tempi di deploy.

Seed Round e fiducia nell'AI

Il finanziamento è stato co‑guidato da Andreessen Horowitz e Lightspeed Venture Partners, con la partecipazione di Sequoia Capital, Altimeter, Redpoint e ZhenFund. È uno dei round seed più ingenti nella storia dell’AI infrastructure, in linea con lo spin‑out di SGLang (RadixArk) che ha raccolto capitali per una valutazione di circa 400 milioni di dollari.

L’investimento riflette un cambiamento di paradigma: l’attenzione degli investitori si sposta dalla sola formazione dei modelli (training) alla fase operativa di deploy (inference), oggi percepita come il collo di bottiglia infrastrutturale dell’AI.

Il successo open source di VLLM

vLLM è nato nel 2023 nel laboratorio UC Berkeley guidato da Ion Stoica (co‑fondatore di Databricks) e ha rapidamente conquistato il ruolo di framework open source di riferimento per accelerare l’inferenza di modelli LLM.

A oggi, vLLM vanta un ecosistema esteso: oltre 2.000 contributori, supporto per più di 500 architetture di modelli, compatibilità con oltre 200 tipi di acceleratori (NVIDIA, AMD, TPU, Intel e altri) e utilizzo su scala globale da parte di colossi tech come Meta, Google, Amazon e Character.ai.

Inferact: infrastruttura di inferenza

Nel sito ufficiale e nella dichiarazione del team si legge che Inferact non abbandonerà l’open source; al contrario, le ottimizzazioni sviluppate verranno restituite alla comunità.

Ma la vera scommessa è costruire un prodotto commerciale che incapsuli il valore di vLLM: dal controllo multi‑tenant, autoscaling, osservabilità dei costi per token, alle certificazioni hardware.

Insomma, un vero e proprio “control plane” operativo, simile al modello adottato da Red Hat per Linux o da Databricks per Spark.

Ad esempio, Lightspeed descrive Inferact come un’estensione naturale di vLLM in un’era in cui l’inference verso i modelli agentici e multimodali domina i costi e le complessità infrastrutturali.

Strategia, rischi e ambizioni

Il valore del seed round (800 milioni di dollari) si giustifica solo se Inferact saprà diventare lo standard operativo dell’inferenza LLM. Gli aspetti critici da monitorare includono:

1. Capacità di competere con hyperscaler che potrebbero costruire soluzioni interne o biforcare il codice open source;

2. Sfida rispetto a stack proprietari come TensorRT‑LLM di NVIDIA, ottimizzati verticalmente su hardware dedicato;

3.

Mantenimento della fiducia della community, evitando il tipico fallimento dell’open‑core in cui l’interesse commerciale sovrasta l’impegno open source.

Il mercato dell'inferenza AI

L’inferenza AI sta crescendo rapidamente: in molte applicazioni (agent, RL, generazione sintetica) il compute di test-time ora domina i costi operativi.

Altri attori affermati stanno anch’essi accumulando capitali: Baseten ha raccolto 300 milioni a una valutazione di 5 miliardi di dollari, Fireworks AI – con cui Inferact condivide parte dell’investitore Lightspeed – ha una valutazione di 4 miliardi di dollari e ha raccolto 250 milioni di dollari in serie C.

Una nuova era per l'AI

La nascita di Inferact rappresenta un momento simbolico nella transizione dell’intero settore AI.

L’inference non è più un dettaglio post‑training, ma il fronte principale dove si definiscono competitività, sostenibilità ed efficienza dei modelli AI in produzione. Se Inferact riuscirà a coniugare governance open source e servizi enterprise, potrebbe diventare il “Linux dell’inferenza” – un’infrastruttura invisibile ma essenziale.

La scommessa dei fondi è chiara: non comprare solo codice, ma l’intero ecosistema e il modello operativo dietro vLLM. Resta da vedere se Inferact saprà giocare la partita con equilibrio tra comunità, scalabilità e controllo ecosistemico, diventando il vero standard tecnico di un’AI che cresce oltre i modelli.