Cover Image for Midjourney lanza V7, su primer nuevo modelo de inteligencia artificial para imágenes en casi un año.

Midjourney lanza V7, su primer nuevo modelo de inteligencia artificial para imágenes en casi un año.

Midjourney, uno de los primeros servicios de generación de imágenes por inteligencia artificial en línea, ha lanzado su primer nuevo modelo de generación de imágenes en casi un año.

Midjourney, uno de los primeros servicios de generación de imágenes mediante inteligencia artificial en la web, ha presentado su nuevo modelo de IA después de casi un año. Llamado V7, este modelo comenzó su fase de prueba alfa en la madrugada del jueves, justo una semana después de que OpenAI lanzara un generador de imágenes en ChatGPT que rápidamente ganó popularidad por su capacidad de crear fotos al estilo Ghibli. Aunque el nuevo modelo de Midjourney no está optimizado para este estilo, sí es capaz de generar obras visualmente atractivas, al menos según la opinión de este reportero.

La fase de prueba alfa del modelo V7 se ha señalado como una de las más completas hasta la fecha, prometiendo ser el más inteligente, hermoso y coherente de los modelos anteriores. Los usuarios que deseen utilizar V7 deberán primero clasificar alrededor de 200 imágenes para crear un perfil de “personalización” en Midjourney, si es que no lo han hecho previamente. Este perfil ajusta el modelo a las preferencias visuales individuales, y es el primer modelo de Midjourney que tiene la personalización activada por defecto.

Una vez que el usuario complete este proceso, podrá activar o desactivar V7 en la página web de Midjourney y, si es miembro del servidor de Discord de la plataforma, también a través del chatbot de Discord. En la aplicación web, es sencillo seleccionar el modelo deseado desde un menú desplegable junto a la etiqueta “versión”.

El CEO de Midjourney, David Holz, describió V7 como una "arquitectura totalmente diferente". En su anuncio, Holz señaló que el modelo es más eficaz con los prompts de texto y que la calidad de las imágenes es visiblemente superior, destacando la coherencia y los detalles en cuerpos, manos y diversos objetos. V7 está disponible en dos versiones: Turbo (más costosa de operar) y Relax, y se acompaña de una nueva herramienta llamada Draft Mode, que permite renderizar imágenes a una velocidad diez veces mayor y a la mitad del costo en comparación con el modo estándar. Aunque las imágenes en Draft Mode son de menor calidad, pueden mejorarse y volver a renderizarse fácilmente.

Holz también indicó que algunas características estándar de Midjourney aún no están disponibles para V7, tales como la mejora de imágenes y el retexturizado, pero que están previstas para ser implementadas en un futuro próximo. Él enfatizó que este es un modelo nuevo con fortalezas y debilidades únicas, y sugiere a los usuarios explorar diferentes estilos de prompts para descubrir sus capacidades.

En pruebas preliminares, V7 mostró un cumplimiento razonable con los prompts, aunque no tuve la oportunidad de evaluarlo en profundidad. Midjourney es una operación peculiar, iniciada en 2022 por Holz, quien cofundó la compañía de periféricos para PC Leap Motion, sin haber recaudado financiamiento externo. A finales de 2023, se reportó que la empresa esperaba generar aproximadamente 200 millones de dólares en ingresos. Recientemente, la firma con sede en San Francisco anunció la creación de un equipo de hardware para abordar proyectos no especificados y continúa entrenando modelos previamente anunciados para la generación de video y objetos en 3D. No obstante, la compañía enfrenta varias demandas que la acusan de infringir los derechos de millones de artistas al entrenar herramientas de IA utilizando imágenes extraídas de la web sin el consentimiento de sus creadores.