Un nuevo modelo de inteligencia artificial desarrollado en China, llamado DeepSeek-R1, está revolucionando el panorama global de la IA. Este modelo, lanzado el 20 de enero de 2025 por la startup china DeepSeek, ha sorprendido a la comunidad científica al igualar el rendimiento de los modelos más avanzados de OpenAI, como el o1, y hacerlo a una fracción del costo. Además, su enfoque abierto para la investigación lo convierte en un competidor único en el mercado.
DeepSeek-R1 es un modelo de lenguaje avanzado diseñado para realizar tareas complejas de razonamiento paso a paso, imitando procesos cognitivos humanos. En pruebas iniciales, ha demostrado un desempeño sobresaliente en áreas como química, matemáticas y programación, alcanzando niveles comparables a los mejores modelos de OpenAI. Sin embargo, lo que realmente lo distingue es su accesibilidad: DeepSeek ha publicado el modelo con pesos abiertos bajo una licencia MIT, permitiendo a investigadores de todo el mundo examinar y construir sobre su algoritmo.
Un modelo con pesos abiertos significa que los parámetros entrenados del modelo (conocidos como «pesos») están disponibles públicamente para que otros investigadores, desarrolladores o empresas puedan descargarlos y utilizarlos. Los pesos son el resultado del proceso de entrenamiento del modelo, donde aprende a realizar tareas específicas a partir de grandes cantidades de datos.
Transparencia tecnológica
En términos simples, los pesos son como el «conocimiento» que el modelo ha adquirido durante su entrenamiento. Al hacerlos abiertos, los creadores permiten que otros puedan usar el modelo tal como está para sus propios proyectos, ajustarlo (una técnica conocida como fine-tuning) para tareas específicas, así como estudiar cómo funciona internamente, promoviendo la transparencia y la investigación.
Esto contrasta con los modelos «cerrados», donde los pesos no se comparten públicamente, lo que impide a otros replicar o modificar el modelo. La apertura de los pesos fomenta la colaboración científica y la innovación, ya que permite a la comunidad global construir sobre avances existentes sin empezar desde cero. Según explica Mario Krenn, del Instituto Max Planck para la Ciencia de la Luz, «la apertura de DeepSeek es notable». Aunque no es completamente de código abierto debido a la falta de acceso a los datos de entrenamiento, esta estrategia ya está atrayendo a investigadores interesados en explorar sus capacidades.
Un modelo eficiente y accesible
DeepSeek-R1 también destaca por su eficiencia económica. Mientras que entrenar modelos equivalentes puede costar decenas de millones de dólares (Meta gastó aproximadamente $60 millones en su modelo Llama 3.1), DeepSeek logró desarrollar R1 con un presupuesto estimado de $6 millones. Además, las pruebas realizadas con este modelo son significativamente más económicas: experimentos que costarían más de 355.47 euros con OpenAI pueden realizarse por menos de 9.68€ con R1.
La startup ha creado versiones «destiladas» del modelo para investigadores con recursos computacionales limitados, democratizando aún más el acceso a esta tecnología.
El contexto global: IA y geopolítica
El éxito de DeepSeek-R1 llega en un momento crítico para China, que enfrenta restricciones por parte de Estados Unidos en el acceso a chips avanzados para procesamiento de IA. Sin embargo, este logro demuestra que la eficiencia y la optimización pueden ser tan importantes como los recursos computacionales masivos. François Chollet, investigador en Seattle, comentó: «el hecho de que provenga de China muestra que ser eficiente con tus recursos importa más que solo escalar computacionalmente».
Además, este avance subraya el auge de los modelos grandes de lenguaje (LLMs) en China y su creciente protagonismo en la escena tecnológica global. DeepSeek ya había llamado la atención anteriormente con su chatbot V3, que superó a competidores importantes pese a contar con un presupuesto limitado.
Implicaciones futuras
La aparición de DeepSeek-R1 podría cambiar las reglas del juego en el desarrollo y adopción global de inteligencia artificial. Su bajo costo y accesibilidad podrían fomentar una mayor colaboración internacional y acelerar descubrimientos científicos en múltiples disciplinas. Asimismo, pone presión sobre gigantes tecnológicos como OpenAI y Meta para reconsiderar sus estrategias comerciales y enfoques hacia la transparencia.
En un mundo donde la inteligencia artificial está moldeando industrias enteras y redefiniendo las capacidades humanas, DeepSeek-R1 no solo es un avance tecnológico; es un símbolo del potencial transformador cuando se combinan innovación, eficiencia y apertura.