Cover Image for Microsoft cancela la actualización de Dall-E tras quejas sobre la calidad de las imágenes.

Microsoft cancela la actualización de Dall-E tras quejas sobre la calidad de las imágenes.

Microsoft tuvo que deshacer una actualización reciente de su modelo de generación de imágenes de Bing, después de que los usuarios expresaran su descontento, señalando que sus creaciones de inteligencia artificial presentaban una calidad inferior a la de antes.

Microsoft ha decidido revertir su más reciente actualización del sistema de generación de imágenes de Bing, tras recibir numerosas quejas de los usuarios sobre la calidad de las imágenes producidas. Esta actualización había implementado la última versión del modelo Dall-E de OpenAI, conocido como PR16. Desde el lanzamiento de Bing Image Creator en la primavera pasada, los usuarios han creado miles de millones de imágenes a partir de descripciones textuales.

El anuncio inicial de esta actualización, hecho a finales del año pasado, prometía un modelo que sería "dos veces más rápido y con una mayor calidad". Sin embargo, Jordi Ribas, el jefe de búsqueda de Microsoft, señaló que las pruebas internas de la compañía mostraban que la calidad de las imágenes generadas por PR16 era "un poco mejor en promedio" en comparación con las generadas por la versión anterior, Dall-E PR13. No obstante, los usuarios han reportado una experiencia diferente. Un comentario en el subreddit de Bing expresaba la frustración de un usuario: “El DALLE que solíamos amar, se ha ido para siempre”.

Para mitigar la frustración general, Ribas anunció que la compañía regresará al modelo anterior de generación de imágenes mientras se resuelven los problemas de calidad con PR16, un proceso que podría llevar un par de semanas. "Hemos podido [reproducir] algunos de los problemas reportados y planeamos regresar a PR13 hasta que podamos corregirlos", escribió Ribas en una publicación. Agregó que el proceso de implementación es bastante lento y llevará entre 2 y 3 semanas alcanzar el 100%.

Microsoft y OpenAI no son las únicas empresas enfrentando dificultades con sus generadores de imágenes. En febrero de 2024, Google tuvo que deshabilitar temporalmente el modelo de imágenes de Gemini debido a la aparición de representaciones racialmente ofensivas.

En otro ámbito, OpenAI ha estado en el centro de la controversia por la filtración de su modelo de generación de video, Sora. Un grupo que se opone a las acciones de "art washing" de la empresa divulgó el acceso no autorizado a la API de Sora, permitiendo a los usuarios generar clips de video durante un breve periodo antes de que el acceso fuera revocado. Por otro lado, ChatGPT también ha recibido mejoras significativas en su modelo de lenguaje, prometiendo ofrecer una escritura más natural y personalizada.