
Google presenta una inteligencia artificial para comunicarse con delfines.
DolphinGemma, desarrollado por Google, es un modelo de código abierto creado para interpretar los sonidos que emiten los delfines.
Científicos de Google DeepMind han creado un innovador modelo de inteligencia artificial (IA) que tiene el potencial de avanzar en la investigación sobre el lenguaje de los delfines, y en el futuro facilitar herramientas para una comunicación interactiva con esta especie de cetáceos. La comunidad científica ha estado trabajando durante años para entender cómo se relacionan los delfines, considerados uno de los animales más inteligentes del mundo. Las investigaciones anteriores han mostrado que estos mamíferos marinos se comunican mediante chasquidos, silbidos, gestos y vibraciones en su piel, un método no muy diferente al de los humanos.
Un caso particular implica a un delfín nariz de botella que se desplazó a un área alejada de su grupo en el mar Báltico. Científicos de Dinamarca sugirieron que sus silbidos podrían estar dirigidos a llamar a su manada, aunque esta hipótesis aún es discutible. El equipo de Google formuló una pregunta crucial: ¿qué sucedería si los investigadores pudieran no solo escuchar los sonidos de los delfines, sino también interpretarlos con tal precisión que pudieran generar respuestas que sean comprensibles y naturales?
Con esta idea en mente, nació DolphinGemma, un modelo de IA de código abierto diseñado para analizar las vocalizaciones de los delfines y, eventualmente, producir sonidos que faciliten una interacción significativa entre especies. Este modelo se desarrolló en estrecha colaboración con investigadores del Instituto Tecnológico de Georgia y utiliza registros recopilados por el Proyecto Delfín Salvaje (WDP), que desde 1985 ha documentado la comunicación natural y las interacciones sociales de los delfines moteados del Atlántico (Stenella frontalis) en las aguas de las Bahamas.
El equipo de Google explica que las grabaciones submarinas han permitido vincular directamente los sonidos con comportamientos específicos, algo que no podría haber sido logrado solo con la observación en superficie. Este enfoque no invasivo ha generado una base de datos única, que incluye décadas de grabaciones de video y audio submarinos, asociadas a la identidad de los delfines, sus historias de vida y comportamientos observados.
DolphinGemma fue entrenado utilizando la vasta base de datos acústica del WDP. Su funcionamiento se basa en versiones optimizadas de Gemma, la familia de modelos de IA que respalda parte de la tecnología detrás de los algoritmos Gemini de Google. Con una estructura de aproximadamente 400 millones de parámetros, el modelo puede operar en dispositivos móviles, como los smartphones Google Pixel.
Según lo detallado por la compañía, DolphinGemma trabaja como un sistema que procesa sonidos naturales de delfines para identificar patrones, estructurar información y predecir vocalizaciones futuras, de manera similar a cómo los grandes modelos de lenguaje anticipan la siguiente palabra en una oración. A partir de la próxima temporada de trabajo de campo, se empleará DolphinGemma para detectar patrones de sonido habituales y secuencias coherentes en la comunicación de los delfines.
Los científicos consideran que este modelo puede acelerar la comprensión de las estructuras y significados en la comunicación entre delfines, lo que tradicionalmente requería mucho tiempo y esfuerzo humano. A largo plazo, se espera que los patrones identificados, junto con sonidos sintéticos creados para representar objetos comunes en la vida de los delfines, sirvan como base para desarrollar un vocabulario compartido que facilite una interacción bidireccional con los humanos.
En paralelo, se está desarrollando un sistema llamado CHAT (Telemetría de Aumento Auditivo para Cetáceos), también respaldado por el Instituto Tecnológico de Georgia. Este dispositivo está diseñado para no solo comprender el lenguaje de los delfines, sino para crear un sistema de comunicación más accesible. El objetivo es asociar silbidos sintéticos con objetos que interesan a los delfines, como sargazo o pastos marinos, fomentando que imiten estos sonidos para solicitar objetos.
Para la comunicación fluida entre delfines y humanos, CHAT debe realizar tareas complejas en tiempo real, como escuchar las vocalizaciones de los delfines y responder rápidamente identificando lo que se ha solicitado. DolphinGemma optimiza el funcionamiento de CHAT al anticipar e identificar las imitaciones antes de que finalicen, facilitando así interacciones más naturales.
Gran parte de estas tareas se realizan utilizando un Google Pixel 6, que permite llevar a cabo análisis acústicos de alta fidelidad. Este dispositivo simplifica el mantenimiento y reduce el consumo energético, lo que es crucial para operar en ambientes marinos desafiantes. Se anticipa que la próxima generación del proyecto, que se lanzará en verano, usará el nuevo Google Pixel 9, que tendrá altavoces y micrófonos mejorados, además de mayor capacidad de procesamiento.
Aunque DolphinGemma se ha entrenado con vocalizaciones de delfines moteados del Atlántico, los desarrolladores prevén que el modelo podría adaptarse para estudiar otras especies, como los delfines mulares o los delfines tornillo, ajustando los parámetros a las características acústicas de cada tipo de delfín. A pesar del largo camino que queda por recorrer para comprender completamente la comunicación de los delfines, la colaboración entre el WDP, el Instituto Tecnológico de Georgia y Google está abriendo nuevas y emocionantes oportunidades para reducir la distancia comunicativa entre humanos y delfines.