Cover Image for Una nueva aplicación mágica que convierte tu teléfono en un AI Ron Burgundy

Una nueva aplicación mágica que convierte tu teléfono en un AI Ron Burgundy

La startup de inteligencia artificial ElevenLabs lanzó su aplicación Reader para iOS el miércoles, un modelo que promete leer en voz alta las palabras de prácticamente cualquier fuente de contenido.

El inicio planificado de la función de texto a voz de OpenAI para ChatGPT fue pospuesto, mientras que la startup de audio AI ElevenLabs lanzó su aplicación Reader para iOS el miércoles. Este modelo promete leer en voz alta las palabras de prácticamente cualquier fuente de contenido, como artículos de noticias, PDF, ePubs y boletines, incluso enlaces web pegados. La aplicación ElevenLabs para iOS permite escuchar cualquier artículo, libro o documento usando voces generadas por AI, que el usuario podrá seleccionar de una biblioteca de "voces humanas de alta calidad". Además, podrán controlar la velocidad a la que la voz modulada por AI lee el texto. La aplicación Reader está disponible en iPhone, iPad y iPod Touch con iOS y iPadOS 15 o versiones posteriores, inicialmente en Estados Unidos, Reino Unido y Canadá. La empresa tiene planeado lanzar el software en la Unión Europea en unas semanas, alrededor del 11 de julio. Se está trabajando en una versión para Android y la compañía ofrece una lista de espera para los usuarios interesados.

ElevenLabs está considerando futuras actualizaciones para el servicio, como reproducción sin conexión, acceso a fuentes RSS, resumen por AI y la capacidad de compartir fragmentos con amigos. La empresa también busca expandir los idiomas hablados a los 29 idiomas soportados por su modelo multilingüe. Según el anuncio del miércoles de ElevenLabs, "crear modelos de audio AI de alta calidad no es suficiente. Los creadores necesitan herramientas para crear y los consumidores necesitan interfaces para consumir audio". En cuanto al costo del servicio, la empresa eventualmente empezará a cobrar por él, aunque aún no se ha especificado el precio de la suscripción.

Los modelos de voz AI generados por ElevenLabs están entrenados con datos de dominio público, acuerdos con socios comerciales y datos de acceso público. Con esto, la empresa puede ofrecer una variedad de servicios, desde doblaje y traducción automática hasta clonación de voces y narración automática, incluso generando voces de AI para NPCs construidos en el motor Unreal Engine.