Cover Image for El CEO de OpenAI, Sam Altman, señala que la escasez de capacidad de computación está retrasando los productos de la empresa.

El CEO de OpenAI, Sam Altman, señala que la escasez de capacidad de computación está retrasando los productos de la empresa.

El CEO de OpenAI, Sam Altman, reconoció que la falta de capacidad de procesamiento es una de las razones que impide a la empresa lanzar productos con la frecuencia que desearía.

Sam Altman, CEO de OpenAI, reconoció en una sesión de preguntas y respuestas en Reddit que la escasez de capacidad de procesamiento es un obstáculo significativo que impide a la empresa lanzar productos con mayor frecuencia. En respuesta a una interrogante sobre por qué los nuevos modelos de inteligencia artificial de OpenAI han tardado tanto en desarrollarse, Altman explicó que “todos estos modelos se han vuelto bastante complejos” y mencionó las limitaciones y difíciles decisiones relacionadas con la asignación de los recursos de computación a diversas ideas prometedoras.

Varios informes indican que OpenAI ha enfrentado problemas para conseguir una infraestructura de computación suficiente para entrenar y ejecutar sus modelos generativos. Recientemente, un medio de comunicación indicó que OpenAI ha estado colaborando con Broadcom para desarrollar un chip de inteligencia artificial destinado a correr modelos, con expectativas de que este chip esté disponible a más tardar en 2026.

Debido a esta limitada capacidad, Altman anunció que la nueva función de conversación avanzada de ChatGPT, conocida como Advanced Voice Mode, no incorporará las capacidades visuales que se habían anticipado en abril. En un evento realizado en dicho mes, OpenAI mostró una versión de la aplicación de ChatGPT funcionando en un smartphone y respondiendo a señales visuales, como la ropa que llevaba puesta una persona en el campo de visión de la cámara del dispositivo. Sin embargo, se reveló que esa demostración fue apresurada con el propósito de desviar la atención del evento para desarrolladores I/O de Google que se llevaba a cabo en la misma semana.

Dentro de OpenAI, algunos miembros consideraban que el modelo GPT-4o no estaba listo para ser presentado, lo cual se evidenció en el retraso del lanzamiento de la versión solo de voz de Advanced Voice Mode. Durante la misma sesión, Altman mencionó que no hay un cronograma actualizado para el lanzamiento de DALL-E, su generador de imágenes, y que aún están perfeccionando Sora, su herramienta de generación de video. Kevin Weil, director de producto de OpenAI, indicó que Sora ha enfrentado contratiempos técnicos que le han dificultado competir con sistemas rivales como los de Luma y Runway.

Se reportó que el sistema original de Sora, presentado en febrero, tardaba más de 10 minutos en procesar un clip de video de un minuto. En octubre, uno de los co-líderes de Sora, Tim Brooks, dejó la compañía para unirse a Google. Altman también comentó que OpenAI sigue considerando la posibilidad de permitir contenido "NSFW" en ChatGPT “algún día”, y enfatizó que la principal prioridad de la empresa es mejorar su serie de modelos de razonamiento o1 y sus sucesores. Este semana, OpenAI dio un avance de varias características que llegarán a o1, incluida la comprensión de imágenes, anunciando que hay “muy buenos lanzamientos” previstos para finales de este año, aunque aclarando que nada de esto se denominará GPT-5.