Gemini 3.5 Live Translate: voz fluida y en tiempo real, ¿cómo funciona?

Gemini 3.5 Live Translate: voz fluida y en tiempo real, ¿cómo funciona?

Recibe noticias al instante en WhatsApp

El nuevo modelo de voz de Google traduce 70 idiomas en tiempo real y sin pausas

El gigante tecnológico de Mountain View ha dado un salto histórico en el procesamiento de lenguaje natural. Google anunció el lanzamiento oficial de Gemini 3.5 Live Translate. Este avanzado modelo de audio de voz a voz en vivo procesa el habla de manera continua. La herramienta ya traduce más de un billón de palabras mensuales para miles de millones de usuarios en todo el mundo.

A diferencia de los sistemas tradicionales por turnos, este software genera voz en flujo constante. El sistema equilibra el contexto y la inmediatez. Esto elimina por completo las pausas incómodas en la conversación.

Integración multiplataforma y herramientas de desarrollo

La nueva tecnología ya está disponible en el ecosistema global de la compañía. Los desarrolladores pueden acceder a ella en vista previa pública mediante Google AI Studio y la API Gemini Live. El sistema destaca por su alta robustez al ruido ambiental. Además, gestiona entradas multilingües de forma automatizada y sin configuraciones manuales previas. Plataformas como LiveKit y Pipecat ya integran este código para facilitar la creación de aplicaciones con Gemini 3.5 Live Translate.

A nivel empresarial, la aplicación de videollamadas Google Meet recibirá una actualización profunda este mes. El sistema ampliará su soporte desde cinco idiomas estándar hasta más de 70 lenguas simultáneas. Esto permitirá habilitar más de 2,000 combinaciones lingüísticas dentro de una misma sesión virtual.

Profundiza este contenido con: Alianza entre Google y Apple lleva a Gemini a Siri

Seguridad digital y experiencia móvil con Gemini 3.5 Live Translate

Los usuarios particulares podrán experimentar esta actualización en las aplicaciones oficiales de Google Translate para iOS y Android. Al conectar cualquier par de auriculares, el sistema replicará con precisión el ritmo, tono y entonación original del hablante.

Para los usuarios del sistema operativo de Google, se implementará un novedoso “modo de escucha” privado. Este formato permite pegar el teléfono al oído como en una llamada convencional para escuchar la traducción. En el ámbito de la seguridad, la empresa incorporó una marca de agua imperceptible mediante la tecnología SynthID. Este rastro digital se teje en el flujo de audio para identificar el contenido sintético. Con esto se busca prevenir campañas de desinformación y asegurar un despliegue responsable de Gemini 3.5 Live Translate.

Aquí va un video, no te lo pierdas: