La calidad de las llamadas de Google Duo está mejorando para los usuarios con Internet lento gracias a la IA
Existe una pequeña posibilidad de que alguien haya logrado evitar las videollamadas o los servicios de llamadas de voz que dependen de las conexiones a Internet en esta etapa, gracias en gran parte a la pandemia mundial.
Existe una posibilidad aún menor de que estas llamadas hayan estado completamente libres de fallas, fallas, latencia y otros artefactos dañinos, pero el último avance en la división de inteligencia artificial de Google debería ayudar en ese frente.
Como se publicó en el Blog de IA de Google, el equipo desarrolló un nuevo códec de audio denominado Lyra, con el objetivo específico de comprimir la voz a una tasa de bits más baja.
A solo 3 kbps (eso es kilobits por segundo), Lyra usa datos significativamente más bajos que el códec más utilizado en la actualidad: Opus de código abierto, que «logra una calidad de voz transparente, indistinguible del original» a 32 kbps, pero puede funcionar a velocidades más bajas.
De hecho, en estudios de Google, se encontró que el códec Opus que opera a 8 kbps era menos preferible que Lyra a 3 kbps, lo que representa una reducción del 60% en el ancho de banda.
Google Duo
En la publicación del blog, Google AI anunció que está «lanzando Lyra [in Google Duo] para mejorar la calidad y confiabilidad de las llamadas de audio en conexiones de ancho de banda muy bajo «.
Por lo tanto, si es un usuario de Google Duo en Android o iOS y tiene conexiones a Internet deficientes o inconsistentes, pronto verá una mejora significativa en la calidad y estabilidad de las llamadas.
No hay una mención específica de cuándo el códec estará ampliamente disponible, pero es probable que sea una actualización entre bastidores, por lo que es posible que no llegue con mucha fanfarria cuando aterrice.
AI y el futuro
Los avances de Lyra se deben a la combinación de la tecnología de códec existente con la inteligencia artificial de Google y «avances en el aprendizaje automático con modelos entrenados en miles de horas de datos». Estos datos incluyen hablantes en más de 70 idiomas, disponibles de forma gratuita en bibliotecas de código abierto, para garantizar que sean de aplicación universal.
LA Blog profundiza en los detalles de cómo este aprendizaje automático permitió la nueva tecnología, además de usar fragmentos de audio para demostrar la diferencia entre el audio original, Lyra y otros códecs a varias velocidades de bits.
El equipo planea continuar optimizando Lyra, mejorando su calidad y confiabilidad con la esperanza de que se adopte fuera de la aplicación Google Duo. Esto probablemente signifique que otras aplicaciones y servicios de VOIP y videoconferencia se beneficiarán del códec en el futuro. .
Además, la publicación también afirma que el equipo «también está comenzando a investigar cómo estas tecnologías pueden conducir a un códec de audio de propósito general de baja tasa de bits», lo que podría significar que los casos de uso tácito como música y otros tipos de audio pueden ver las mismas mejoras.