Prueba el nuevo generador de imágenes de IA de Gemini, Imagen 3, que desafía a DALL-E de Google.

Imagen 3 transformará tus sueños en una realidad digital fotográfica.

La llegada del generador de imágenes más avanzado de Google, conocido como Imagen 3, marca un hito importante, ya que fue presentado durante el evento Google I/O de este año y ahora está disponible en la plataforma de IA Gemini de Google. La herramienta se ofrece tanto en una versión gratuita como a través de un servicio de suscripción, Gemini Advanced, y también se incorpora en los productos comerciales de Google. Con esto, la compañía busca posicionar a Imagen 3 como un competidor atractivo en un entorno cada vez más saturado de generadores de imágenes basados en inteligencia artificial.

Al igual que sus versiones anteriores, Imagen 3 permite la creación de imágenes en múltiples estilos, incluyendo paisajes fotorealistas y animaciones de arcilla. Este nuevo modelo representa una mejora significativa respecto a su predecesor, especialmente en la generación de imágenes de personas. Google ha indicado que Imagen 3 no repetirá los errores históricos que causaron problemas a la empresa anteriormente, aunque todavía se mantiene la prohibición sobre la creación de "individuos identificables y fotorealistas".

Una de las características más destacadas de Imagen 3 es la posibilidad de editar en tiempo real, lo que permite a los usuarios proporcionar su opinión sobre las imágenes generadas y solicitar modificaciones. Aunque en su lanzamiento no se ha mencionado la opción de señalar áreas específicas para ajustar, se espera que esta funcionalidad llegue en el futuro. Inicialmente, Imagen 3 está disponible en inglés, pero se prevé la incorporación de más idiomas en los próximos meses. Google parece tener la intención de hacer de Gemini la opción predeterminada para los usuarios, al igual que muchos recurren automáticamente a su motor de búsqueda.

Además, Imagen 3 reafirma el compromiso de Google con la transparencia mediante el uso de la herramienta SynthID, que marca con una firma invisible las imágenes generadas por IA. Esto impide que sean malinterpretadas como fotos reales o como obras de autoría. SynthID se presenta como una medida contra la desinformación y busca hacer más transparente el mundo de las imágenes generadas por inteligencia artificial, complementando las normas de seguridad ya establecidas para evitar la creación de imágenes conflictivas.

La introducción de Imagen 3 evidencia el acelerado avance en la creación de imágenes de IA y su integración en diversas plataformas de creación de contenido. Google, al haber integrado Imagen 3 en su ecosistema, posee una ventaja sobre competidores que ofrecen herramientas independientes. A medida que las opciones como Ideogram y Midjourney funcionan de manera aislada, otros, como OpenAI con DALL-E, lo usan como una característica central en ChatGPT. La combinación de Imagen 3 con Gemini proporciona a Google un impulso notable, aunque la competencia en el espacio de generadores de imágenes seguirá siendo intensa e incierta.

IA
Generación de imágenes
Google Gemini

Relacionado

Claude de Anthropic se lanza al mundo profesional.

| septiembre 4, 2024

Relacionado

Claude de Anthropic se lanza al mundo profesional.

| septiembre 4, 2024