Cover Image for DeepSeek AI podría ser más inteligente que la IA más avanzada de OpenAI, y ya está disponible para probarla.

DeepSeek AI podría ser más inteligente que la IA más avanzada de OpenAI, y ya está disponible para probarla.

Es relevante destacar que DeepSeek R1 es de código abierto.

Ha surgido un nuevo competidor en el ámbito de la inteligencia artificial, y merece la pena prestarle atención. Recientemente, la empresa china DeepSeek presentó su modelo de lenguaje grande de código abierto, llamado DeepSeek R1. Según la compañía, este nuevo modelo supera a otros LLMs populares, como los de OpenAI, en varias pruebas de referencia importantes, destacándose en tareas de matemáticas, programación y razonamiento.

DeepSeek R1 es, en realidad, una evolución de DeepSeek R1 Zero, que había sido entrenado sin un método convencional conocido como ajuste fino supervisado. Aunque Zero demostraba ser muy competente en ciertas actividades, era descrito por DeepSeek como teniendo "pobre legibilidad y mezcla de idiomas". R1 aborda estas limitaciones mediante la incorporación de "entrenamiento en múltiples etapas y datos de inicio en frío", antes de ser mejorado con aprendizaje por refuerzo.

Entre los aspectos más relevantes de DeepSeek R1 se encuentra su naturaleza de código abierto, lo que permite su revisión por expertos y podría disminuir inquietudes relacionadas con la privacidad y la seguridad. Además, se ofrece de forma gratuita como una aplicación web, y el acceso a la API es muy asequible, con un costo de $0.14 por un millón de tokens de entrada, en comparación con los $7.5 que cobra OpenAI por su modelo más potente.

El rendimiento de DeepSeek R1 es notable. Al realizar una prueba, el autor pidió al modelo que desarrollara una aplicación web compleja que necesitara analizar datos públicos y crear un sitio dinámico con información sobre viajes y clima. Sorprendentemente, DeepSeek generó un código HTML completamente aceptable de inmediato y pudo realizar mejoras en el sitio basándose en la retroalimentación recibida, optimizando el código a lo largo del proceso.

Además, al solicitar consejos para mejorar sus habilidades en ajedrez en cinco minutos, el modelo ofreció una serie de consejos útiles. Sin embargo, el autor no pudo implementar estos ajustes debido a la falta de motivación. Al intentar poner a prueba la inteligencia de DeepSeek en tres frases, el autor se sorprendió al darse cuenta de que no tenía el conocimiento suficiente para evaluar o comprender completamente las respuestas proporcionadas.

A pesar de su impresionante rendimiento, es importante destacar que los costos de entrenamiento de DeepSeek son significativamente menores en comparación con otros modelos competidores. Esto sugiere que una inteligencia artificial sofisticada, capaz de razonamiento, no necesariamente tiene que ser costosa de entrenar ni de utilizar.