Nell'ultimo annuncio di Google Cloud, l'azienda ha presentato l'ottava generazione dei suoi chip personalizzati per l'intelligenza artificiale, conosciuti come unità di elaborazione tensore (TPU). Questi nuovi chip sono stati suddivisi in due categorie: il TPU 8t, destinato al training dei modelli, e il TPU 8i, progettato per l'inferenza. Quest'ultima è la fase operativa del modello, ovvero ciò che avviene quando gli utenti inviano richieste.
Le Caratteristiche dei Nuovi TPU
I nuovi TPU di Google promettono prestazioni impressionanti rispetto alle generazioni precedenti: fino a tre volte più veloci nel training dei modelli AI, con un miglioramento dell'80% delle prestazioni per dollaro speso, e la capacità di far lavorare insieme oltre un milione di TPU in un unico cluster.
Queste innovazioni dovrebbero tradursi in un maggiore potere computazionale con un consumo energetico e costi ridotti per i clienti.
Google sta proponendo questi chip come soluzioni complementari, piuttosto che sostitutive, per i sistemi basati su Nvidia che già offre nella sua infrastruttura cloud. Infatti, nonostante la spinta verso le proprie soluzioni, Google prevede di integrare l'ultimo chip di Nvidia, chiamato Vera Rubin, entro la fine dell'anno.
Collaborazione Strategica con Nvidia
Lontano dall'essere un attacco frontale a Nvidia, l'approccio di Google indica una collaborazione strategica. Le due aziende stanno lavorando insieme per migliorare la tecnologia di networking software nota come Falcon, che consentirebbe ai sistemi basati su Nvidia di funzionare in modo più efficiente nel cloud di Google.
Questo approccio collaborativo mira a garantire che, malgrado i crescenti investimenti di Google nei propri chip, Nvidia continui a svolgere un ruolo cruciale nel suo ecosistema cloud.
Il Contesto Competitivo e Gemini Enterprise
L’annuncio arriva nel mezzo della competizione serrata tra i grandi fornitori di cloud — Amazon, Microsoft e Google — per diventare il riferimento per i carichi di lavoro AI. L'integrazione di nuove funzionalità di sicurezza, governance e orchestrazione nella piattaforma Gemini Enterprise di Google riflette la strategia dell'azienda di soddisfare le crescenti esigenze delle grandi imprese meglio dei concorrenti come Anthropic.
I nuovi chip TPU di Google rappresentano un passo importante nel definire il futuro delle operazioni cloud, ma la collaborazione con Nvidia dimostra che il mercato dei chip AI è complesso e interdipendente. Mentre Google potenzia le sue capacità AI, resta da vedere come evolverà questa dinamica di collaborazione e competizione con Nvidia e gli altri big del settore.