Meta lanza una versión 'abierta' del generador de podcasts de Google.
Meta ha lanzado una versión 'abierta' de la popular función de generación de pódcast que se encuentra en NotebookLM de Google, denominada NotebookLlama.
Meta ha lanzado una implementación "abierta" de la popular función para generar pódcast de NotebookLM, conocida como NotebookLlama. Este nuevo proyecto utiliza los modelos Llama de la propia Meta para realizar gran parte del procesamiento. Al igual que en NotebookLM, NotebookLlama tiene la capacidad de crear resúmenes en formato de pódcast a partir de archivos de texto que se le envían. Primero, el sistema genera una transcripción de un archivo —como un PDF de un artículo informativo o una entrada de blog—. Posteriormente, añade “más dramatización” e interrupciones antes de enviarlo a modelos de texto a voz que son de código abierto.
A pesar de su funcionalidad, los resultados no suenan tan bien como los de NotebookLM. En las muestras de NotebookLlama que se han analizado, las voces tienen una calidad notoriamente robótica y, en ocasiones, tienden a hablarse unos a otros en momentos inusuales. Sin embargo, los investigadores de Meta reconocen que esta calidad puede mejorarse con modelos más avanzados. En la página de GitHub de NotebookLlama, comentan: “El modelo de texto a voz limita cuán natural sonará esto. [Además,] otra forma de estructurar el pódcast podría ser haciendo que dos agentes debatan sobre el tema de interés y redacten el esquema del pódcast. Actualmente, utilizamos un único modelo para escribir el esquema del pódcast”.
NotebookLlama no es el primer intento de replicar la función de pódcast de NotebookLM. Algunos proyectos han tenido más éxito que otros, pero ninguno —ni siquiera NotebookLM— ha sido capaz de resolver el problema de las alucinaciones que afecta a todas las inteligencias artificiales. Esto significa que los pódcasts generados por IA tienen probabilidades de contener información inventada.