In un settore AI sempre più esposto a errori e derive incontrollate, due approcci distinti emergono per migliorare l'affidabilità. Probably ha raccolto 9 milioni di dollari per un sistema anti-allucinazioni, mentre ZeroDrift ha ottenuto 10 milioni per un livello deterministico di compliance tra modello e utente. Entrambe le strategie ridefiniscono le garanzie sui risultati AI, con forti implicazioni per la governance.
Probably: ingegneria di precisione contro gli errori AI
Probably ha chiuso un round seed da 9 milioni di dollari (Andreessen Horowitz), puntando a una precisione del 99,99%, finora irraggiungibile per i Large Language Models (LLM).
Il suo primo prodotto è uno strumento di data science che genera risposte rapide da dataset complessi, con citazione e audit trail. Il cuore è una "corazza" ("data science mech suit") che filtra le risposte degli LLM, confrontandole con un validatore deterministico. Le risposte non corrispondenti vengono rigettate e il modello addestrato. Processo ottimizzato per velocità e accuratezza.
Questo approccio permette l'uso di modelli AI "quattro classi inferiori" rispetto ai modelli di frontiera, consentendo l'esecuzione su hardware locale. Ciò riduce drasticamente i costi dei token e aumenta l'accessibilità. Il fondatore Peter Elias spiega: «se il contesto è sufficientemente raffinato, il modello non deve sforzarsi molto per fare la cosa giusta.
È un esercizio nel ridurre l'ambiguità», sottolineando la centralità dell'harness engineering.
ZeroDrift: guardrail di conformità in tempo reale
ZeroDrift, supportato da Andreessen Horowitz (a16z Speedrun), ha completato un round seed da 10 milioni di dollari per sviluppare una "firewall di compliance" che opera in tempo reale, intercettando ogni comunicazione AI prima dell'invio all'utente.
Il sistema intercetta comunicazioni AI (email, chatbot, audio, video) e le confronta con regole predefinite (SOC 2, GDPR, FINRA, SEC, MiFID II, HIPAA). In caso di violazione, un LLM riscrive il messaggio. ZeroDrift promette maggiore affidabilità e latenza ridotta, un vantaggio competitivo in contesti regolamentati.
Il round, chiuso rapidamente e sottoscritto tre volte oltre l'offerta, segnala una forte domanda aziendale per la governance proattiva dell'AI. Il target primario sono i chatbot rivolti ai consumatori, dove risposte non conformi creano rischi. L'azienda mira anche alle comunicazioni machine-to-machine non supervisionate.
Convergenze e strategie per l'affidabilità AI
Entrambe le startup riconoscono che gli LLM non sono intrinsecamente affidabili. Probably riduce l'ambiguità nell'input contestuale, spostando il controllo sulla qualità dell'ambiente di esecuzione. ZeroDrift, invece, applica un'interdizione normativa prima della risposta del modello.
Operativamente, Probably riduce costi e aumenta la portabilità con modelli locali.
ZeroDrift si posiziona come infrastruttura di governance, aumentando la fiducia dei team di compliance e riducendo errori regolatori alla fonte. Emerge la necessità di governare l'AI e di controllarla prima della generazione delle risposte.
Impatto futuro e il nuovo standard di precisione AI
Probably può rivoluzionare gli strumenti di analisi, fornendo risposte affidabili da dataset complessi su hardware comune, in settori come finanza, sanità e audit. ZeroDrift risponde a esigenze immediate di compliance per società regolamentate (finanza, assicurazioni, healthcare, legale), riducendo i rischi senza stravolgere le architetture AI esistenti.
In prospettiva, i modelli potrebbero convergere: harness engineering per contesto e affidabilità, affiancato da un livello di compliance per policy e regolamenti.
Questo doppio approccio potrebbe diventare il nuovo standard di affidabilità. La sfida non è solo creare modelli più intelligenti, ma architetture capaci di controllarli. La precisione è un risultato da costruire nell'ingegneria e nei sistemi che circondano i modelli stocastici.