enero 22, 2025

DeepSeek AI podría ser más inteligente que la IA más avanzada de OpenAI, y ya está disponible para probarla.

Es relevante destacar que DeepSeek R1 es de código abierto.

Ha surgido un nuevo competidor en el ámbito de la inteligencia artificial, y merece la pena prestarle atención. Recientemente, la empresa china DeepSeek presentó su modelo de lenguaje grande de código abierto, llamado DeepSeek R1. Según la compañía, este nuevo modelo supera a otros LLMs populares, como los de OpenAI, en varias pruebas de referencia importantes, destacándose en tareas de matemáticas, programación y razonamiento.

DeepSeek R1 es, en realidad, una evolución de DeepSeek R1 Zero, que había sido entrenado sin un método convencional conocido como ajuste fino supervisado. Aunque Zero demostraba ser muy competente en ciertas actividades, era descrito por DeepSeek como teniendo "pobre legibilidad y mezcla de idiomas". R1 aborda estas limitaciones mediante la incorporación de "entrenamiento en múltiples etapas y datos de inicio en frío", antes de ser mejorado con aprendizaje por refuerzo.

Entre los aspectos más relevantes de DeepSeek R1 se encuentra su naturaleza de código abierto, lo que permite su revisión por expertos y podría disminuir inquietudes relacionadas con la privacidad y la seguridad. Además, se ofrece de forma gratuita como una aplicación web, y el acceso a la API es muy asequible, con un costo de $0.14 por un millón de tokens de entrada, en comparación con los $7.5 que cobra OpenAI por su modelo más potente.

El rendimiento de DeepSeek R1 es notable. Al realizar una prueba, el autor pidió al modelo que desarrollara una aplicación web compleja que necesitara analizar datos públicos y crear un sitio dinámico con información sobre viajes y clima. Sorprendentemente, DeepSeek generó un código HTML completamente aceptable de inmediato y pudo realizar mejoras en el sitio basándose en la retroalimentación recibida, optimizando el código a lo largo del proceso.

Además, al solicitar consejos para mejorar sus habilidades en ajedrez en cinco minutos, el modelo ofreció una serie de consejos útiles. Sin embargo, el autor no pudo implementar estos ajustes debido a la falta de motivación. Al intentar poner a prueba la inteligencia de DeepSeek en tres frases, el autor se sorprendió al darse cuenta de que no tenía el conocimiento suficiente para evaluar o comprender completamente las respuestas proporcionadas.

A pesar de su impresionante rendimiento, es importante destacar que los costos de entrenamiento de DeepSeek son significativamente menores en comparación con otros modelos competidores. Esto sugiere que una inteligencia artificial sofisticada, capaz de razonamiento, no necesariamente tiene que ser costosa de entrenar ni de utilizar.

inteligencia artificial modelos de lenguaje código abierto

Relacionado

H, la startup de inteligencia artificial que consiguió $220 millones, presenta su primer producto: Runner H para aplicaciones 'agentes'.

INTELIGENCIA ARTIFICIAL, AUTOMATIZACIÓN DE PROCESOS, STARTUPS TECNOLÓGICAS

| noviembre 20, 2024

Relacionado

H, la startup de inteligencia artificial que consiguió $220 millones, presenta su primer producto: Runner H para aplicaciones 'agentes'.

INTELIGENCIA ARTIFICIAL, AUTOMATIZACIÓN DE PROCESOS, STARTUPS TECNOLÓGICAS

| noviembre 20, 2024

Instagram impide búsquedas de #demócratas y otros hashtags políticos.

Trump critica los programas de financiamiento para estaciones de carga de vehículos eléctricos de los que se beneficia Tesla.

Después de dos meses con el Oclean X Ultra S, descubrí mucho sobre mis hábitos de cepillado.

A24 anuncia la fecha de lanzamiento de Warfare de Alex Garland.

DeepSeek AI podría ser más inteligente que la IA más avanzada de OpenAI, y ya está disponible para probarla.

Es relevante destacar que DeepSeek R1 es de código abierto.

H, la startup de inteligencia artificial que consiguió $220 millones, presenta su primer producto: Runner H para aplicaciones 'agentes'.

H, la startup de inteligencia artificial que consiguió $220 millones, presenta su primer producto: Runner H para aplicaciones 'agentes'.