RadixArk rappresenta un esempio di startup nata da un progetto open source, trasformatosi in realtà commerciale. Il team alla guida dello strumento SGLang, sviluppato per velocizzare e rendere più efficiente l’inferenza dei modelli AI, ha dato vita a RadixArk, valutata circa 400 milioni di dollari. Questo passaggio segna un momento cruciale nell’evoluzione del mercato dell’infrastruttura AI: l’inferenza diventa il nuovo terreno di investimento strategico.

Dalla ricerca accademica a startup

SGLang è nato nel 2023 nel laboratorio dell’Università di California, Berkeley, diretto da Ion Stoica, cofondatore di Databricks.

L’accelerazione dell’inferenza è un elemento sempre più competitivo per la sostenibilità operativa dei servizi AI. L’interesse verso SGLang è cresciuto rapidamente, al punto che il team ha deciso di fondare RadixArk, portando con sé personale chiave come Ying Sheng, ex ingegnera di xAI e ricercatrice presso Databricks, ora CEO dell’azienda.

Modello open‑core e nuova architettura

RadixArk adotta un approccio “open‑core”: SGLang resta disponibile come motore open source per favorire adozione e contributi, mentre l’azienda sviluppa e vende servizi commerciali avanzati. Tra le iniziative in corso, figura lo sviluppo di Miles, un framework dedicato al reinforcement learning, pensato per rendere i modelli AI in grado di migliorarsi nel tempo.

RadixArk ha già iniziato a monetizzare tramite servizi di hosting e supporto enterprise.

Inferenza: il nuovo campo di battaglia dell’AI

Il mercato dell’infrastruttura AI sta investendo massicciamente nel livello di inferenza, considerato il volano per l’adozione su larga scala: anche piccoli guadagni in performance si traducono in risparmi economici per le aziende che gestiscono grandi volumi di richieste AI. Progetti simili come vLLM hanno attratto offerte per funding fino a $160 milioni e una valutazione prossima al miliardo.

Parallelamente, startup indipendenti si affermano con valutazioni elevate: Baseten ha raccolto $300 milioni a una valutazione di $5 miliardi, e Fireworks AI $250 milioni a una valutazione di $4 miliardi.

La convergenza di queste iniziative segnala una chiara tendenza: l’inferenza è il nuovo cuore dell’estrazione di valore nell’AI.

Strategia e sfide future

RadixArk può beneficiare di diversi vantaggi: una base open source attiva, esperienza tecnica e un percorso verso contratti enterprise. Tuttavia, il passaggio da open source a entrate ricorrenti dipenderà dalla capacità di trasformare i risparmi in casi d’uso reali, offrire supporto in ambienti complessi, garantire SLA elevati e integrare logiche di sicurezza.

Dal punto di vista tecnologico, segnali da tenere d’occhio includono:

- benchmark real-world sulle principali architetture come LLaMA 3 o modelli con mixture-of-experts (MoE)

- compatibilità con schemi di quantizzazione come AWQ/GPTQ

- prestazioni su contesti lunghi – dove la gestione della cache chiave-valore e l’attenuazione della latenza sono decisivi.

Impatto sull'AI: efficienza e sostenibilità

Startup come RadixArk abbassano la barriera d’ingresso all’intelligenza artificiale avanzata: accelerando l’inferenza e riducendo i costi, consentono a organizzazioni anche al di fuori del tech di integrare modelli generativi, promuovendo innovazioni in diversi settori. Inoltre, un’inferenza più efficiente contribuisce alla sostenibilità energetica delle operazioni AI continuative.

Dal lato competitivo, il mercato si fa affollato: lo spazio tra teamwork accademico e operatività industriale, tra open source e servizi premium, tra strumenti generici e soluzioni su misura sarà decisivo. La vittoria sarà di chi saprà bilanciare comunità, innovazione tecnica e rigore commerciale.

Nel percorso che va dal codice collaborativo alla startup valutata centinaia di milioni, RadixArk incarna la fusione tra ricerca accademica e mercato. Mentre il mercato dell’inferenza AI esplode, la sfida diventa tradurre il potenziale tecnico in valore economico sostenibile.