Cover Image for El funcionamiento de OpenAI o1 "Strawberry": la inteligencia artificial que realiza razonamientos secuenciales y establece un nuevo paradigma.

El funcionamiento de OpenAI o1 "Strawberry": la inteligencia artificial que realiza razonamientos secuenciales y establece un nuevo paradigma.

La empresa detrás de ChatGPT ha compartido información sobre lo que se denomina oficialmente "OpenAI o1", destacando que, además de la escala, existen otros factores clave que son esenciales para el progreso continuo de la inteligencia artificial.

OpenAI ha realizado un notable progreso en el ámbito de la inteligencia artificial con el desarrollo de su nuevo modelo, conocido como OpenAI o1. Este modelo ofrece una forma de "razonamiento" lógico que le permite abordar problemas complejos de manera más efectiva que los modelos de IA actuales, incluyendo al anterior modelo de la compañía, GPT-4o. A diferencia de estos modelos predecesores, que suelen generar respuestas instantáneamente, OpenAI o1 trabaja mediante un proceso de razonamiento que simula el pensamiento humano, reflexionando en voz alta antes de llegar a una conclusión.

Mira Murati, directora de tecnología de OpenAI, destaca que este nuevo enfoque representa un cambio de paradigma en los modelos de IA, ya que mejora significativamente la forma de resolver tareas que requieren un razonamiento complejo. Aunque OpenAI o1 no está destinado a substituir a GPT-4o, sino que actúa como un complemento, la empresa también está en el proceso de desarrollar su próximo modelo maestro, conocido como GPT-5, el cual será considerablemente más grande.

Los modelos de lenguaje grande (LLM) típicamente generan respuestas a partir de vastas redes neuronales y grandes volúmenes de datos. Si bien son capaces de demostrar habilidades impresionantes, tienen dificultades con problemas sencillos que requieren razonamiento lógico. OpenAI o1 aborda este desafío mediante el uso del aprendizaje por refuerzo. Esta técnica permite que el modelo mejore sus capacidades de razonamiento, recibiendo retroalimentación positiva por respuestas correctas y negativa por respuestas incorrectas.

Mark Chen, vicepresidente de investigación de OpenAI, mostró cómo el nuevo modelo puede resolver problemas que GPT-4o no puede, incluyendo un complicado dilema matemático. Chen enfatiza que el nuevo modelo está diseñado para aprender a pensar por sí mismo, en lugar de simplemente imitar el razonamiento humano.

El rendimiento de OpenAI o1 ha sido notable en varios conjuntos de problemas, destacándose en áreas como programación, matemáticas y ciencias. En un examen de matemáticas para estudiantes, GPT-4o obtuvo una media del 12% de respuestas correctas, mientras que o1 logró un impresionante 83%.

Sin embargo, el modelo OpenAI o1 tiene desventajas. Es más lento que su predecesor y no siempre proporciona mejores resultados. A diferencia de GPT-4o, no tiene la capacidad de realizar búsquedas en internet ni de trabajar con datos multimodales, como imágenes y audio.

La mejora del razonamiento en los modelos de lenguaje ha sido un tema recurrente en la investigación, y otras empresas, como Google, también están explorando enfoques en esta área. A pesar de los avances realizados, las capacidades de razonamiento de los modelos de lenguaje siguen siendo objeto de estudio, y los expertos reconocen la necesidad de sistemas más robustos.

Adicionalmente, Murati afirma que la técnica presentada podría ayudar a garantizar que los modelos de inteligencia artificial actúen de manera segura y alineada con los valores humanos. Oren Etzioni, profesor de la Universidad de Washington, subraya la importancia de capacitar a estos modelos para resolver problemas complejos y ejecutar tareas que requieren múltiples pasos.

Chen concluye que el enfoque de razonamiento que está adoptando OpenAI puede conducir a desarrollos en inteligencia artificial que no dependan exclusivamente de un gran poder de cálculo, sugiriendo así un futuro en el que la inteligencia artificial sea más accesible.

  • Inteligencia Artificial
  • Razonamiento
  • OpenAI