Google annuncia l'integrazione della generazione musicale nell'app Gemini. La novità, disponibile in beta, introduce le capacità di Lyria 3, il modello audio generativo sviluppato da DeepMind. La funzionalità permette agli utenti di creare brani di 30 secondi, completi di testi se richiesto, direttamente dall'interfaccia del chatbot, senza dover uscire dall'applicazione. Si tratta di un passo significativo nel campo dell'AI creativa, che espande ulteriormente le possibilità di espressione personale offerte da Gemini.

Funzionamento di Lyria 3 su Gemini

Lyria 3 consente la creazione di canzoni strumentali o con testi generati automaticamente. Il processo parte da descrizioni testuali che specificano stati d'animo, generi musicali o ricordi. È inoltre possibile caricare immagini o video: l'AI ne interpreterà il mood visivo per generare una traccia sonora coerente. La composizione è arricchita da una cover art generata da Nano Banana. Il risultato finale è un brano di circa 30 secondi, pronto per essere condiviso.

Gli utenti hanno la possibilità di controllare vari elementi, come stile, vocalità, tempo e mood, garantendo una generazione altamente personalizzata. Rispetto alle versioni precedenti, Lyria 3 produce tracce più complesse e realistiche, caratterizzate da un migliore layering sonoro e una maggiore fluidità nella performance vocale.

Diffusione globale e protezioni etiche

La funzione è accessibile a livello globale per gli utenti maggiorenni (18+), con supporto a diverse lingue, tra cui inglese, tedesco, spagnolo, francese, hindi, giapponese, coreano e portoghese. Sono state implementate specifiche protezioni per prevenire imitazioni dirette di artisti noti. Il modello si basa su ispirazioni stilistiche generiche e utilizza filtri per evitare somiglianze eccessive.

Ogni traccia generata è dotata di un watermark digitale SynthID, invisibile ma tracciabile, che ne identifica l'origine AI. L'app integra anche strumenti di verifica: gli utenti possono caricare file audio e chiedere a Gemini di determinare se sono stati generati dall'AI, basandosi sul riconoscimento del watermark.

Impatto sull’ecosistema dei creator

Parallelamente, Google estende l'accesso al modello Lyria 3 per i creator su YouTube attraverso la funzione Dream Track, precedentemente limitata agli Stati Uniti. Ora disponibile globalmente, questa funzionalità permette agli autori di integrare musica generata dall'AI nei loro contenuti.

Questa apertura amplia le possibilità creative per YouTuber e creator, sollevando tuttavia interrogativi nel settore della produzione musicale tradizionale riguardo al copyright e al valore dell'opera umana. La strategia di Google, attraverso filtri e watermark, mira a bilanciare innovazione e tutela dei diritti.

Una novità attesa e ben accolta

Il lancio era stato anticipato da segnalazioni nel codice dell'app Gemini, indicando l'arrivo di una sezione musicale ("My Stuff") e di una funzionalità di generazione musicale in sviluppo.

Oggi, queste previsioni si concretizzano per molti utenti.

Le prime impressioni da test interni e feedback degli utenti descrivono un'esperienza fluida e coinvolgente, capace di stimolare la creatività personale. La possibilità di modificare il brano tramite chat e costruirlo progressivamente posiziona Gemini tra le piattaforme AI più intuitive per la creazione artistica.

L’introduzione di Lyria 3 in Gemini non mira a sostituire la musica umana, ma a democratizzare la composizione. Creare un tema musicale, un pensiero sonoro o un ricordo sonoro diventa un processo immediato e accessibile a chiunque, in modo interattivo, creativo e protetto.