Cover Image for Will Smith degustando espaguetis y otras peculiaridades de IA que se popularizaron en 2024.

Will Smith degustando espaguetis y otras peculiaridades de IA que se popularizaron en 2024.

En 2024, benchmarks de inteligencia artificial peculiares como Will Smith comiendo espaguetis, Pictionary y Minecraft ganaron una gran popularidad. ¿A qué se debe este fenómeno?

Con la llegada de un nuevo generador de videos impulsado por inteligencia artificial, no tardó en surgir un curioso fenómeno que captura la atención: un clip del actor Will Smith disfrutando de un plato de espaguetis. Este video no solo se ha convertido en un meme, sino también en un punto de referencia no oficial para evaluar la efectividad de este tipo de tecnología. En febrero, el propio Smith hizo una parodia sobre esta tendencia en Instagram.

Aparentemente, este video de Will Smith comiendo pasta es solo uno de los muchos benchmarks extraños que han emergido en la comunidad de inteligencia artificial durante 2024. Un joven desarrollador de 16 años creó una aplicación que permite que la IA controle Minecraft, así como evaluar su capacidad para diseñar estructuras. Por otro lado, un programador británico desarrolló una plataforma donde diferentes IAs compiten en juegos como Pictionary y Conecta 4.

Aunque existen pruebas más académicas para medir el desempeño de las IA, los estándares convencionales a menudo no son significativos para la mayoría de las personas. Muchas compañías presumen la eficiencia de sus sistemas en exámenes de matemáticas de alto nivel o desafíos complejos de posgrado, sin embargo, la mayoría de los usuarios utiliza chatbots para tareas más comunes como la gestión de correos electrónicos o investigaciones sencillas.

Un ejemplo relevante en este ámbito es el Chatbot Arena, un sistema que permite a los usuarios evaluar las habilidades de distintas IA en tareas específicas, como la creación de aplicaciones web o la generación de imágenes. Sin embargo, las opiniones de los participantes tienden a proceder de círculos de la industria tecnológica y no reflejan a la población general.

Ethan Mollick, profesor de gestión en Wharton, ha subrayado que muchos benchmarks en la industria no comparan estos sistemas con el rendimiento del usuario promedio. Este vacío en la evaluación es notable, especialmente en sectores críticos como la medicina o el derecho, donde un marco de referencia más amplio sería valioso.

Por otro lado, aunque benchmarks inusuales como el de Will Smith o los juegos mencionados no son empíricos, su atractivo radica en que son entretenidos y fáciles de comprender. Con la complejidad inherente a la tecnología de IA, la industria todavía enfrenta el reto de simplificar esta información para el público. Por lo tanto, es probable que sigamos viendo la aparición de nuevos benchmarks peculiares en el futuro cercano.