Il 19 febbraio 2026, TechCrunch ha annunciato la nascita di Mirai, una startup londinese fondata da Dima Shvets e Alexey Moiseenkov — figure chiave dietro Reface e Prisma — con l'obiettivo di ottimizzare l'inferenza on-device su smartphone e laptop. Mirai mira a superare i limiti economici e tecnici della dipendenza dal cloud, proponendo un SDK che consente agli sviluppatori di integrare funzionalità generative come summarization e classificazione con poche righe di codice, mantenendo al contempo un'elevata qualità del risultato.

Una visione condivisa per risolvere un problema reale

Shvets e Moiseenkov, forti delle loro esperienze con app consumer di successo basate su AI on-device come Reface (face-swap) e Prisma (filtri AI), avevano già identificato i limiti dell'IA cloud-centrica. In un contesto dominato dal dibattito su infrastrutture cloud e tecnologie AGI, hanno colto un'opportunità significativa: l'IA on-device per il consumatore, con margini di costo più sostenibili e prestazioni ottimizzate.

Un engine proprietario ottimizzato

Mirai ha sviluppato un motore di inferenza in Rust, capace di accelerare la generazione di output fino al 37% senza alterare i pesi del modello, preservando così la qualità. Attualmente, il sistema supporta modelli per testo e voce, con piani futuri per la visione computerizzata e l'estensione ad Android.

La startup intende inoltre pubblicare benchmark on-device per facilitare agli sviluppatori la misurazione delle performance dei modelli edge.

SDK semplice da integrare per un deploy rapido

Mirai punta a un'esperienza utente simile a quella offerta da Stripe: registrazione sulla piattaforma, integrazione di una API key e poche righe di codice sono sufficienti per attivare funzioni come summarization, classificazione o trascrizione direttamente sul dispositivo. Il backend, sviluppato in Rust, garantisce efficienza e velocità.

Strategie ibride: combinare edge e cloud

Consapevole che non tutte le operazioni possono essere eseguite offline, Mirai sta sviluppando un livello di orchestrazione che indirizza al cloud solo le richieste non gestibili sul dispositivo, bilanciando così performance e capacità.

Supporto degli investitori e visione futura

Mirai ha raccolto 10 milioni di dollari in un seed round guidato da Uncork Capital, con la partecipazione di investitori di rilievo. Andy McLoughlin di Uncork sottolinea come, nonostante gli ingenti investimenti nel cloud, i costi dell'inferenza stiano diventando insostenibili. "Prima o poi, chiunque vorrà eseguire parte del carico di inferenza ai margini della rete, e Mirai è ben posizionata per catturare questa domanda", afferma.

Stato attuale e potenziale di Mirai

L'SDK di Mirai è già disponibile per iOS e macOS e, secondo i fondatori, è già in produzione in un'app del settore health tech con oltre 100 milioni di utenti attivi giornalieri. Supporta modelli come Llama 3.x, Gemma 3, Qwen 3, DeepSeek‑R1, con strumenti integrati per fine-tuning, valutazione, output strutturati e fallback.

Il potenziale è considerevole: assistenti vocali, trascrittori, traduttori e app di chat potranno beneficiare di un'inferenza locale veloce e privata, riducendo la dipendenza dal cloud e i costi operativi.

L'approccio di Mirai si allinea al crescente trend della decentralizzazione dell'AI, dove privacy, latenza ridotta e sostenibilità economica emergono come valori fondamentali. L'adozione di Rust, la semplicità per gli sviluppatori e la visione "edge-first" rendono Mirai una startup degna di nota.

In sintesi, Mirai propone un cambio di paradigma nell'inferenza AI, spostando il focus dal cloud verso il dispositivo, offrendo efficienza, integrazione lineare e scalabilità. Una prospettiva che risponde alla saturazione dei costi cloud e all'esigenza di esperienze intelligenti più rapide e private.