La traduzione vocale avvia una nuova era con Gemini 3.5 Live Translate, l’ultimo modello sviluppato da Google che consente la traduzione parlata in tempo reale su più di 70 lingue. Dopo vent'anni di progressi grazie all’apprendimento automatico, il progetto ha evoluto la traduzione da un esperimento di laboratorio al sistema che ora supporta miliardi di utenti con trilioni di parole tradotte ogni mese.
Con il lancio ufficiale di Gemini 3.5 Live Translate, Google introduce una traduzione orale fluida e naturale, che conserva l'intonazione, il ritmo e il tono del parlante. A differenza dei sistemi tradizionali che aspettano il completamento delle frasi prima di rispondere, il modello traduce il discorso in continuo, mantenendosi sincronizzato con l'oratore e riducendo al minimo i tempi di attesa.
Disponibilità presso i prodotti di Google
3.5 Live Translate è disponibile al momento in anteprima pubblica per gli sviluppatori tramite il Gemini Live API e Google AI Studio. Gli utenti aziendali possono testare la tecnologia in anteprima privata all’interno di Google Meet a partire da questo mese, mentre il pubblico generale potrà utilizzarla nell’app Google Translate, sia su Android che su iOS.
Utilizzo per sviluppatori
Il modello di Gemini 3.5 Live Translate gestisce lo streaming vocale in tempo reale, facilitando la comunicazione tra persone di lingue diverse. Non richiede configurazioni manuale per lingue diverse ed è adatto anche a ambienti rumorosi. Gli sviluppatori possono costruire applicazioni per traduzione vocale durante chiamate, riunioni e insegnamenti utilizzando le capacità di questo modello.
Il Gemini Live API è già in azione nel video dimostrativo che mostra funzionalità di doppiaggio e traduzione simultanea in molteplici lingue. Gli sviluppatori possono esaminare il demo o visitare il Gemini Cookbook per trovare esempi di codice e ulteriori istruzioni.
- Agora
- Fishjam
- LiveKit
- Pipecat
- Vision Agents
Piattaforme come quelle sopra elencate stanno utilizzando Gemini Live API per semplificare la costruzione di app basate sulla traduzione vocale. Questi sistemi gestiscono parte dell'infrastruttura media in tempo reale, permettendo agli sviluppatori di concentrarsi sull’esperienza dell’utente.
Collaborazioni aziendali
La società Grab sta testando Gemini 3.5 Live Translate, mirando ad abilitare una comunicazione multilingue in tempo quasi reale tra autisti e passeggeri. La società ha notevoli volumi di traffico vocale, con oltre 10 milioni di chiamate al mese.
Opinioni positive
Il modello ha ricevuto commenti positivi da parte di aziende come CJ ENM, LiveKit e altre che sottolineano la sua alta qualità, precisione e latenza ridotta.
Applicazione in Google Meet
Nei gruppi di incontro Google Meet, Gemini 3.5 Live Translate migliorerà la traduzione vocale introducendo:
- Supporto per 70+ lingue (dalle precedenti solamente 5)
- Discussioni in oltre 2000 combinatorie di lingue in un’unica riunione
- Riduzione dei tempi di interazione con una traduzione istantanea
Questa funzionalità sarà disponibile in anteprima per clienti aziendali con Workspace Google, con un lancio completo previsto per la fine dell’anno.
Google Translate App
Il modello è disponibile nel’app Google Translate per dispositivi Android e iOS. Nella funzione Live Translate, basta aggiungere un paio di cuffie per ottenere una traduzione più naturale, fedele al tono originale del discorso in più di 70 lingue.
Per gli utenti Android, c’è anche una nuova modalità listening con 3.5 Live Translate. Basta tenere il telefono all’orecchio come una normale chiamata per ascoltare la traduzione direttamente dall’auricolare del telefono. L’esperienza risulta utile quando si vuole ricevere traduzioni in fretta senza distrazioni esterne, specialmente quando non si hanno a disposizione le cuffie.
Sicurezza e risponbilità
Tutti i contenuti audio generati utilizzano una tecnologia denominata SynthID. Questo marchio impercettibile è integrato direttamente nell’audio per rendere rilevabile il contenuto prodotto da modelli AI e prevenire la diffusione di informazioni false. Per ulteriori dettagli, consultare la carta del modello.