La herramienta de detección de inteligencia artificial de Google ya está disponible para todos.
La división DeepMind de Google anunció el miércoles el lanzamiento de su sistema de autenticación de contenido basado en inteligencia artificial, SynthID, para el uso público general.
Google ha anunciado que SynthID ya está disponible para cualquier usuario interesado en probar este sistema de autenticación para contenido generado por inteligencia artificial. Este sistema permite incrustar marcas de agua imperceptibles en imágenes, videos y textos creados por máquinas, lo que ayuda a los usuarios a verificar si un contenido fue producido por humanos o por algoritmos.
La compañía destaca que ha hecho de SynthID una herramienta de marcas de agua de texto de código abierto, accesible de manera gratuita para desarrolladores y empresas, con el objetivo de facilitar la identificación de contenido generado por IA. SynthID hizo su debut en 2023 como una manera de marcar imágenes, audio y video generados por inteligencia artificial. Originalmente, se integró en la plataforma Imagen y su uso se amplió en mayo de 2024, cuando se anunció su incorporación al chatbot Gemini durante el evento I/O.
Este sistema funciona al codificar tokens, que son las unidades básicas de datos empleadas por la IA generativa para interpretar una solicitud y predecir la siguiente palabra en la respuesta. Según un blog de DeepMind, el proceso implica introducir información adicional en la distribución de tokens en el momento de la generación, modulando así la probabilidad de que se generen ciertos tokens. Comparando las elecciones de palabras del modelo con los “puntajes de probabilidad ajustados” en relación con los patrones de puntajes esperados para textos marcados y sin marcar, SynthID puede determinar si una frase fue escrita por una inteligencia artificial.
Un estudio reciente publicado en Nature asegura que este proceso no afecta la precisión, calidad o velocidad de las respuestas, y que el sistema no puede ser fácilmente eludido. A diferencia de los metadatos estándar, que se pueden eliminar con facilidad, se asegura que la marca de agua de SynthID permanece aun cuando el contenido ha sido recortado, editado o modificado.
Soheil Feizi, profesor asociado en la Universidad de Maryland, señala que lograr una marca de agua fiable e imperceptible en el texto generado por IA es un desafío, especialmente en situaciones donde los resultados de modelos de lenguaje son casi deterministas, como en preguntas fácticas o tareas de generación de código. La naturaleza de código abierto del sistema permite a la comunidad probar los detectores y evaluar su eficacia en diferentes contextos, lo cual es fundamental para comprender las limitaciones de estas técnicas.
No obstante, SynthID no es infalible. Aunque es resistente a manipulaciones, sus marcas de agua pueden eliminarse si el texto se introduce en una aplicación de traducción de lenguajes o si se reescribe de manera significativa. Además, su efectividad disminuye en pasajes de texto cortos y al intentar determinar si una respuesta basada en una afirmación fáctica fue generada por IA. Por ejemplo, tanto humanos como máquinas responderán “París” a la pregunta sobre la capital de Francia, que solo tiene una respuesta correcta.
La herramienta SynthID está disponible para su descarga en Hugging Face como parte del actualizada Responsible GenAI Toolkit de Google.