DeepL, già leader nella traduzione testuale, ha lanciato una suite per l'interpretazione vocale in tempo reale. Questa tecnologia di voice-to-voice translation è pensata per meeting, conversazioni mobili e web, e comunicazioni di gruppo. Un'API dedicata consente a sviluppatori e aziende di integrare la soluzione, ad esempio per i call center.
L'evoluzione dalla traduzione testuale alla voce
Il CEO Jarek Kutylowski ha definito l'espansione alla voce un «passo naturale» per DeepL, data la mancanza di un prodotto efficace per la traduzione vocale in tempo reale.
La sfida principale è bilanciare bassa latenza e alta accuratezza.
API vocale e accesso anticipato
Dal 2 febbraio 2026, la Voice API è disponibile per i clienti DeepL API Pro, offrendo streaming audio per trascrizioni e traduzioni istantanee in un massimo di cinque lingue. Un programma di early access per la funzione voice-to-voice è stato avviato a metà febbraio, per sei settimane.
Rivoluzione nei contact center
La nuova API vocale trasforma i contact center. Gli operatori potranno essere selezionati per expertise, non per lingua, ampliando copertura e riducendo costi. La tecnologia garantisce continuità del servizio e offre traduzioni vocali contestuali con trascrizioni sullo schermo.
DeepL punta sul Giappone
DeepL si concentra sul mercato giapponese, prevedendo il rilascio di un software di interpretazione AI-powered entro fine 2026. Leonardo Doin, responsabile ingegneria e ricerca per DeepL Voice, immagina un futuro dove un auricolare permetterà di ascoltare discorsi stranieri nella propria lingua, in tempo reale. Il software integrerà riconoscimento vocale, traduzione automatica e sintesi vocale con voce simile all'oratore, gestendo conversazioni multilingue e multispeaker per meeting aziendali e app per smartphone.
Il progresso dalle soluzioni precedenti
Nel novembre 2024, DeepL aveva lanciato "DeepL Voice", che forniva traduzioni testuali in tempo reale da audio (didascalie e sottotitoli) ma senza output vocale.
La nuova Voice API segna un'evoluzione significativa verso soluzioni di traduzione vocale complete.
Impatto strategico e trend futuri
La transizione alla traduzione vocale in tempo reale riflette un trend chiave nell'AI linguistica: abbattere le barriere comunicative globali. L'offerta di traduzione audio in tempo reale apre scenari per meeting internazionali e assistenza clienti multilingue. La strategia di DeepL include un focus mirato sul Giappone, evidenziando un approccio di localizzazione intelligente. L'API vocale e l'early access facilitano la sperimentazione per le imprese. Il lancio del prodotto giapponese nel 2026 conferma l'approccio su misura di DeepL. In sintesi, DeepL espande la sua piattaforma da traduzioni testuali a interpretazioni vocali real time, con API estese e programmi per mercati strategici.