Digital > Global | ECOS DEL LANZAMIENTO QUE ESTÁ REVOLUCIONANDO AL MERCADO
Redacción Adlatina | Miércoles 29 de enero de 2025

DeepSeek, un nuevo capítulo en la historia de la IA

Eficiencia, colaboración, código abierto y menor coste, las claves del modelo desarrollado por la empresa china, que puso en jaque a Silicon Valley.

El lunes, las acciones del fabricante de chips para inteligencia artificial Nvidia se desplomaron (una caída del 17 por ciento de su valor bursátil), a raíz del lanzamiento de DeepSeek, una herramienta de IA generativa china que puso patas para arriba creencias como que innovación y grandes presupuestos van indefectiblemente de la mano.

El caso de Nvidia fue el más resonante de una jornada negra para las compañías tecnológicas tras la irrupción de un modelo que pone en duda los números millonarios de Silicon Valley en el abordaje y desarrollo de la inteligencia artificial.

Los creadores de DeepSeek aseguran haberlo producido a un coste menor que otros modelos como CharGPT, de OpenAI, dado que utiliza menos chips de tecnología avanzada. Según declararon, desarrollarla costó unos seis millones de dólares y fue posible porque el fundador de DeepSeek acumuló chips de Nvidia antes de que se prohibiera su exportación (a fines de 2022).

“DeepSeek ha comprobado que los modelos de IA con tecnología de punta pueden ser desarrollados con recursos informáticos limitados”, expresó Wei Sun, principal analista de IA del centro de investigación Counterpoint Research, para un artículo publicado la BBC.

Según esta misma publicación, el modelo de IA que lo impulsa -llamado R1- tiene unos 670.000 millones de parámetros, lo que lo convierte en el mayor modelo de lenguaje de fuente abierta hasta la fecha, según Anil Ananthaswamy, autor de Why Machines Learn: The Elegant Math behind Modern AI ("Por qué aprenden las máquinas: Las elegantes matemáticas detrás de la IA moderna").

Tras su lanzamiento, la nueva aplicación, que puede utilizarse de manera gratuita, se ubicó en la cima de descargas de la tienda Apple Store.

¿Quién es Liang Wenfeng?

DeepSeek fue fundada en diciembre de 2023 por Liang Wenfeng, graduado de la Universidad de Zhejiang en ingeniería de información electrónica y ciencias computacionales.

La empresa fue respaldada por High-Flyer, un fondo de cobertura que Liang creó en 2015, que usa IA para analizar datos financieros con miras a tomar decisiones de inversión.

En una entrevista que brindó el año pasado, Wenfeng señaló que el sector de IA de China "no puede continuar siendo un seguidor" y expresó: "Solemos decir que hay una brecha de uno o dos años entre la IA china y la de EE.UU., pero la brecha real está entre la originalidad y la imitación. Si eso no cambia, China seguirá siendo un seguidor".

Cuando se le preguntó por qué el modelo DeepSeek sorprendió a tantos en Silicon Valley, respondió: "Su sorpresa viene de ver una empresa china entrar en el juego como innovadora, no simplemente una seguidora".

El problema de las exportaciones

El presidente de Estados Unidos, Donald Trump, también se pronunció al respecto, en lo que calificó como “una llamada de alarma” para las empresas locales, a quienes instó a concentrarse en “competir para ganar”.

Y es que este fenómeno tiene su costado político y ocurre en medio del debate por las restricciones de Estados Unidos a la exportación de chips avanzados a China.

Sin embargo, lejos de ubicar a China por detrás de Estados Unidos, estas medidas, en palabras de expertos en relaciones internacionales y desarrollos tecnológicos, parecen estar impulsando a empresas emergentes como DeepSeek a centrarse en la eficiencia, compartir recursos y fomentar la colaboración.

En una entrevista con el medio chino 36Kr, publicada en julio de 2024, y retomada actualmente por MIT Technology Review, Liang afirmó que, además de las sanciones a los chips, las empresas chinas enfrentan otro desafío: sus técnicas de ingeniería de IA suelen ser menos eficientes. "Nosotros [la mayoría de las empresas chinas] necesitamos el doble de potencia de cálculo para lograr los mismos resultados. Esto, sumado a la falta de eficiencia de los datos, provoca que necesitemos hasta cuatro veces más potencia de cálculo. Nuestro objetivo es reducir estas brechas", explicó.

“Desde el punto de vista energético, es natural y eficiente que surja algún tipo de división del trabajo en la industria de la IA. La rápida evolución de la IA exige que las empresas chinas se adapten con agilidad para sobrevivir", afirma Thomas Qitong Cao, profesor adjunto de Política Tecnológica en la Universidad de Tufts (EE UU).

Para crear R1, DeepSeek tuvo que reelaborar su proceso de entrenamiento para reducir la tensión en sus GPU, una variedad lanzada por Nvidia para el mercado chino que tiene su rendimiento limitado a la mitad de la velocidad de sus productos superiores, según Zihan Wang, ex empleado de DeepSeek y actual estudiante de doctorado en ciencias de la computación en la Universidad Northwestern. El modelo emplea un enfoque de “cadena de pensamiento” similar al utilizado por ChatGPT o1, que le permite resolver problemas procesando consultas paso a paso.

Si bien muchas de las acciones tecnológicas que se desplomaron el lunes fueron recuperándose con el correr de la semana, no cabe duda de que la llegada de DeepSeek marca una nueva era en la carrera por el desarrollo de la inteligencia artificial y los intereses de mercado en torno a ella.