Google Traduttore abbatte ogni barriera con la traduzione vocale in tempo reale in 70 lingue con Gemini
Google lancia Gemini 3.5 Live Translate: traduzione vocale in tempo reale in 70+ lingue su Google Translate, Meet e API. Ecco come funziona. L'articolo Google Traduttore abbatte ogni barriera con la traduzione vocale in tempo reale in 70 lingue con Gemini sembra essere il primo su Smartworld.

Google Traduttore compie vent'anni e per festeggiare lancia qualcosa che va ben oltre un semplice aggiornamento. Gemini 3.5 Live Translate è il nuovo modello audio di Google pensato per la traduzione vocale in tempo reale, e la differenza rispetto a quello che avevamo prima è sostanziale: non aspetta che tu finisca di parlare per tradurre, ma genera l'audio tradotto in modo continuo, restando solo qualche secondo indietro rispetto all'interlocutore.
Il risultato, almeno sulla carta, è una conversazione che scorre senza le pause imbarazzanti dei sistemi tradizionali. Il modello preserva intonazione, ritmo e tono della voce originale, rileva automaticamente oltre 70 lingue senza bisogno di configurazioni manuali e funziona anche in ambienti rumorosi.
Il rollout parte oggi su tre fronti distinti.
- Gli sviluppatori possono già accedere al modello in anteprima pubblica tramite la Gemini Live API e Google AI Studio.
- Le aziende che usano Google Meet lo riceveranno in anteprima privata questo mese, con un'espansione più ampia prevista entro fine anno.
- Per tutti gli altri, il modello arriverà direttamente nell'app Google Traduttore su Android e iOS.
Su Android c'è anche una novità specifica: la modalità ascolto, che permette di tenere lo smartphone all'orecchio come durante una telefonata e ricevere la traduzione direttamente nell'auricolare del dispositivo, senza cuffie. Utile quando non vuoi che gli altri sentano la traduzione, o semplicemente quando le cuffie non le hai con te. Su entrambe le piattaforme, collegando qualsiasi paio di cuffie si accede alla funzione Live Translate con la traduzione che replica anche il tono del parlante.
Per Google Meet, il salto è notevole: si passa da 5 lingue supportate a oltre 70, e soprattutto vengono abilitate più di 2.000 combinazioni linguistiche in una sola riunione, non solo traduzioni da e verso l'inglese come prima. L'interfaccia viene aggiornata per rendere l'accesso alla traduzione immediato.
Tra i partner che stanno già testando il modello c'è Grab, il servizio di ride-hailing del Sud-Est asiatico, che lo sta usando per facilitare le comunicazioni tra autisti e passeggeri al momento del ritiro. Oltre 10 milioni di chiamate vocali al mese passano attraverso la piattaforma Grab, il che rende questo un banco di prova tutt'altro che banale.
Piattaforme per sviluppatori come Agora, LiveKit e Pipecat si integrano già con la Gemini Live API per costruire app di traduzione vocale, gestendo l'infrastruttura di streaming in tempo reale così che chi sviluppa possa concentrarsi sull'esperienza utente. Tutti i contenuti audio generati dal modello includono il watermark SynthID di Google, invisibile all'orecchio ma rilevabile dai sistemi di verifica, per tenere traccia dei contenuti generati dall'AI.
Siamo curiosi di vedere quanto reggerà sul campo in italiano, soprattutto nelle situazioni più caotiche dove la traduzione simultanea ha storicamente mostrato i suoi limiti: accenti regionali, sovrapposizioni di voci, terminologia tecnica. Il potenziale c'è, ma la prova del nove è sempre quella dell'uso quotidiano.
L'articolo Google Traduttore abbatte ogni barriera con la traduzione vocale in tempo reale in 70 lingue con Gemini sembra essere il primo su Smartworld.