DeepSeek-R1, la IA china que promete competir contra Open AI

DeepSeek-R1, la IA china que promete competir contra Open AI

El modelo de lenguaje a gran escala DeepSeek-R1, desarrollado en China, está causando revuelo en la comunidad científica al posicionarse como una alternativa accesible y abierta frente a modelos avanzados como el o1 de OpenAI. Lanzado el 20 de enero, R1 se distingue por su enfoque en el razonamiento paso a paso, una capacidad que emula el proceso de pensamiento humano y que resulta crucial para resolver problemas complejos en áreas como la química, las matemáticas y la programación.

Según pruebas iniciales, R1 logra un desempeño comparable al de o1 en estas disciplinas, sorprendiendo a investigadores de todo el mundo. “Esto es salvaje e inesperado”, comentó Elvis Saravia, investigador en IA y cofundador de DAIR.AI, en su cuenta de X.

Apertura como motor de innovación

DeepSeek ha apostado por la transparencia con R1 al lanzarlo bajo una licencia MIT, permitiendo que los investigadores estudien y amplíen su algoritmo. Aunque su modelo no es completamente de código abierto debido a la falta de acceso a los datos de entrenamiento, esta iniciativa representa un avance significativo frente a los modelos de OpenAI, descritos como “cajas negras” por Mario Krenn, líder del Artificial Scientist Lab del Instituto Max Planck.

La accesibilidad también es notable en términos de costos. DeepSeek ha reducido drásticamente los gastos de ejecución: utilizar R1 puede costar una fracción de lo que cuesta operar o1. Experimentos que requerían más de £300 con o1, pueden realizarse con menos de $10 utilizando R1. Además, DeepSeek ha creado versiones más compactas del modelo para investigadores con recursos computacionales limitados, democratizando el acceso a la tecnología.

Innovación en tiempos de restricciones

El desarrollo de R1 destaca no solo por su eficiencia, sino también por las circunstancias en las que se llevó a cabo. DeepSeek operó con un presupuesto de aproximadamente $6 millones para entrenar el modelo, una cifra considerablemente menor en comparación con los $60 millones necesarios para entrenar Llama 3.1 405B de Meta.

Además, el proyecto enfrentó limitaciones impuestas por los controles de exportación de Estados Unidos, que restringen el acceso de las empresas chinas a los chips más avanzados para procesar IA. Pese a ello, R1 logró resultados impresionantes, demostrando que la eficiencia en el uso de recursos puede ser más importante que la escala de cómputo.

Un llamado a la colaboración internacional

El progreso de DeepSeek refleja una reducción significativa en la ventaja percibida de Estados Unidos en el campo de la IA. Alvin Wang Graylin, experto en tecnología, señaló que esta competencia tecnológica debería transformarse en un esfuerzo colaborativo entre naciones, en lugar de perpetuar una carrera armamentista sin ganadores.

El razonamiento como ventaja competitiva

DeepSeek-R1 también pone énfasis en mejorar las capacidades de razonamiento de los modelos de lenguaje. Aunque los modelos actuales entrenan en miles de millones de muestras de texto, muchos sufren de problemas como la invención de hechos o “alucinaciones”. R1 busca superar estas limitaciones con su enfoque basado en “cadena de pensamiento”, lo que lo convierte en una herramienta prometedora para avanzar en la investigación científica y técnica.

Con su combinación de innovación, apertura y accesibilidad, DeepSeek-R1 representa un hito en la inteligencia artificial y podría redefinir el panorama global de los modelos de lenguaje en los próximos años.


🚀 Si buscas mantenerte al día con las noticias nacionales e internacionales más relevantes 🌐

¡Este canal es para ti!