El futuro de la comunicación móvil: llamada de audio IVAS.
Nokia está investigando el futuro de las comunicaciones móviles y cómo las llamadas de audio IVAS están transformando este ámbito.
La comunicación verbal ha sido la principal forma de interacción entre las personas, y la telefonía ha facilitado esta conexión por más de un siglo. A lo largo de los años, las llamadas telefónicas han pasado de ser analógicas a digitales, de fijas a móviles, y han mejorado considerablemente en calidad de audio. Sin embargo, todavía faltaba un gran avance: lograr transmitir un sonido completamente auténtico e inmersivo en tiempo real.
La reciente introducción del códec IVAS (Immersive Voice and Audio Services), estandarizado por 3GPP en su Release 18 en junio de este año, marca un hito importante en la tecnología de audio. A diferencia de las llamadas de voz monofónicas tradicionales, el IVAS permite la transmisión de audio tridimensional e inmersivo, ofreciendo una experiencia comunicativa más rica y realista. Este avance se logra gracias a nuevos formatos de audio optimizados para una experiencia de audio espacial conversacional. Un ejemplo es el formato MASA (Metadata-Assisted Spatial Audio), que utiliza solo dos canales de audio y metadatos para describir el audio espacial. Las llamadas de audio espacial permiten a los usuarios experimentar el sonido como si estuviera ocurriendo en la vida real, incluyendo características como el seguimiento de cabeza.
Con la llegada de la llamada de audio 3D, que representa un salto tecnológico significativo en el campo de las telecomunicaciones, surgen nuevos desafíos para crear una experiencia auténtica e inmersiva. La transmisión de audio espacial, donde los sonidos se perciben como si provinieran de diferentes direcciones, es notablemente más compleja en entornos móviles en comparación con configuraciones controladas como cines o videojuegos. Para lograr esta experiencia inmersiva, es necesario abordar problemas técnicos como el procesamiento de sonido espacial en tiempo real y las limitaciones del hardware.
Uno de los desafíos más significativos para que la comunicación espacial sea efectiva es la reducción de ruidos, esencial para mejorar la claridad del habla en ambientes ruidosos. Las técnicas tradicionales de reducción de ruido suelen filtrar solo sonidos continuos y no son efectivas en todos los contextos. Recientemente, se han realizado avances en la reducción de ruido mediante aprendizaje automático, lo que permite ajustar inteligentemente el nivel de reducción de ruido en función del entorno.
Además, los sistemas de audio inmersivo enfrentan el reto del eco acústico, donde los micrófonos captan sonidos de altavoces cercanos, generando retroalimentación no deseada. La solución a esto ha sido el desarrollo de un sistema de cancelación de eco acústico basado en aprendizaje automático que mejora la calidad del audio en aplicaciones de voz en tiempo real.
El códec IVAS ha sido adoptado recientemente por el 3GPP como un nuevo estándar de voz, desarrollado por la colaboración de 13 empresas y basado en el conocido códec EVS. Este nuevo estándar asegura compatibilidad con servicios de voz existentes. Entre sus principales innovaciones se encuentra el nuevo formato MASA, diseñado para dispositivos con limitaciones de tamaño, como los teléfonos inteligentes. El IVAS incluye un renderizador que soporta audio binaural seguido de seguimiento de cabeza y reproducción multi-altavoz.
La llegada del audio inmersivo 3D revoluciona la experiencia sonora para consumidores, empresas e industrias. Para los usuarios finales, mejora la interacción personal al permitir compartir sonidos locales, tanto en transmisiones en vivo como grabadas. En entornos empresariales, las llamadas de voz en 3D permiten mejorar la experiencia del cliente y optimizar la colaboración en equipo. En el ámbito industrial, el análisis de audio puede fomentar procesos automatizados que mejoren la eficiencia operativa.
A medida que el uso de redes móviles evoluciona, los proveedores de servicios deberán ofrecer soluciones escalables que optimicen el rendimiento en condiciones de ancho de banda variable. El códec IVAS soporta una amplia gama de tasas de bits, garantizando calidad de audio inmersivo en diversas condiciones de red. De cara al futuro, se espera que el comportamiento de los usuarios respecto a la comunicación verbal siga evolucionando, incorporando aplicaciones de mensajería semi-sincrónicas y un mayor uso de llamadas grupales. Con el crecimiento de dispositivos y servicios de realidad extendida, la importancia de la inmersión se volverá un rasgo distintivo en la comunicación.