Por: Rodrigo Bernardo Ortega. 02/05/2025
Las ballenas son los animales más grandes de todo el planeta, con especímenes que alcanzan hasta 30 metros de longitud y un peso de doscientas toneladas. A pesar de su tamaño colosal, se desplazan en el agua con una gracia y discreción tal que, a menudo, los marinos no advierten su presencia hasta que están demasiado cerca. Por eso resulta providencial que el logo de DeepSeek, la empresa de IA china que está revolucionando el sector tecnológico tenga una ballena como su logo.
En febrero de 2025, esta compañía, lanzó un nuevo modelo de inteligencia artificial generativa que resultó ser comparable a los modelos de empresas como OpenAI, Google, Meta y Anthropic. La principal diferencia radica en que DeepSeek afirma haber desarrollado su modelo a una fracción del coste que han invertido las grandes tecnológicas. La prohibición estadounidense de exportar los mejores chips de IA de NVidia significa que DeepSeek ha logrado lo que muchos creían imposible: construir y entrenar uno de los modelos de IA más impresionantes utilizando los chips disponibles en China que creíamos obsoletos: un verdadero “momento Sputnik”.
DeepSeek logró completar el entrenamiento en solo dos meses a un costo de $5.6 millones de dólares, una fracción de las sumas que supuestamente gastaron OpenAI, Google y Meta. A pesar de su extremo bajo coste, las puntuaciones de DeepSeek en los benchmarks de rendimiento de IA demuestran que es tan bueno, si no mejor, que los modelos más recientes de vanguardia de las principales empresas estadounidenses. Es casi tan bueno como el modelo o1 de OpenAI en el “índice de calidad de análisis artificial”, una clasificación independiente de análisis de IA, y supera a los modelos de Google, Anthropic y Meta. NVidia vendía sus chips H100 con un margen de beneficio del 1000% debido a la creencia que sólo con estos chips se podría alcanzar la calidad de modelos de las tecnológicas americanas. Según el informe técnico de DeepSeek, su modelo se entrenó utilizando GPUs NVidia H800, similares a las H100, pero diseñadas específicamente para el mercado chino y así cumplir con las restricciones de exportación estadounidenses.
El nuevo modelo fue anunciado en un informe técnico en diciembre, pero fue publicado (con todos los detalles mencionados) el 21 de enero de 2025. Durante el siguiente fin de semana, la gente empezó a prestar mucha atención a su calidad. El siguiente lunes (27 de enero), al abrir la bolsa, el Nasdaq bajó alrededor del 3,5%, con Nvidia cayendo un 17%. Se trató de una caída de 600.000 millones de dólares en la capitalización bursátil, superior a la capitalización bursátil total de ExxonMobil. Parecería que por fin el mercado tiene una prueba sólida de lo que muchos sospechábamos: que el sector de las grandes tecnológicas estadounidenses está inflado sostenido por un gasto desmesurado.
El tiempo no podría haber sido más inconveniente, apenas unos días antes, el recién inaugurado Trump había anunciado con bombos y platillos el proyecto Stargate, incluyendo planes para construir hasta 20 grandes centros de datos de IA en EE. UU., con una inversión inicial de 100 000 millones de dólares y planes de hasta 500 000 millones de dólares para 2029.
Por ello, con la corrección del mercado, no sólo bajaron las acciones de NVidia y empresas que trabajan con IA; también fueron afectadas empresas de centros de datos, empresas de servicios públicos y gestión energética (pensaban reabrir reactores nucleares para surtir las demandas de energía), el cobre, mineras. Los inversores ahora creen que para el desarrollo de estos modelos ya no requieren las enormes concentraciones de infraestructura de centros de datos a las cuales nos tienen acostumbrados los centros administrados por las empresas tecnológicas de gran capitalización.
De esta venta masiva de acciones también podemos interpretar que los mercados occidentales fallaron en la apuesta de dominar el mercado de la IA con un único modelo ganador (como lo hizo Google en el mundo de buscadores web), la aparición de DeepSeek (y su modelo R1) abre la posibilidad a muchos modelos diferentes ejecutándose en centros de datos más pequeños por todo el mundo.
A diferencia del resto de empresas en el campo de la Inteligencia Artificial, DeepSeek no forma parte de una gran empresa tecnológica ni está financiada por capital de riesgo, en cambio, desde el 2023 DeepSeek ha publicado varios modelos con libre acceso, lo cual ha hecho que el código sea de código abierto. Esta licencia impone muy pocas restricciones a la reutilización, permitiendo a los usuarios modificarlo incluso para uso comercial propietario. También permite hacer un peritaje a como desarrollaron y entrenaron el modelo.
Los ingenieros de IA chinos, al enfrentarse a GPU menos eficientes, se centraron en código más eficiente y encontraron formas inteligentes de sortear las limitaciones. Gracias a las eficiencias que encontraron, entrenar el nuevo modelo costó alrededor de 5,6 millones de dólares, aproximadamente una décima parte de lo que le costó a Meta entrenar su modelo Llama. Este episodio pone de manifiesto los límites de las sanciones tecnológicas, que pueden generar disrupciones a corto plazo, pero su impacto disminuye con el tiempo a medida que otros países innovan y se adaptan. El auge de DeepSeek es un recordatorio de que las limitaciones a veces pueden impulsar la innovación.
En comparación, con acceso ilimitado al dinero, Meta ha gastado hasta ahora más en GPUs que el gobierno de EE. UU. en todo el Proyecto Manhattan (ajustado a la inflación). Open AI ha estado gastando más de cinco mil millones de dólares al año y proyecta que para 2029 gastará casi 40 mil millones de dólares al año.
El ascenso de DeepSeek demuestra que era falsa la creencia que la empresa que pudiera gastar más tenía más probabilidades de ganar la carrera de la IA.
Silicon Valley aparece ahora como el emperador desnudo, todas las grandes promesas de los últimos quince años, como los NFT, la Web3, el metaverso y la realidad virtual, han sido completamente rechazadas por el mercado, y ahora que todos apuestan por la IA generativa, quemando dinero sin una vía real para obtener rentabilidad. El baldado de agua fría de DeepSeek parece que predice la llegada de aún más competencia. DeepSeek no es el único modelo chino de IA. Alibaba, Tencent, ByteDance y Moonshot cuentan con modelos que están alcanzando lentamente a sus pares estadounidenses, sobre todo superándolos en rentabilidad. Debido a las restricciones a la exportación impuestas por EE. UU. a los chips de IA avanzados, las empresas chinas de IA se han visto obligadas a innovar con algoritmos, arquitectura y estrategias de entrenamiento más eficientes.
Aún es muy pronto para afirmar que DeepSeek sea el ganador a largo plazo, pero el hecho de que DeepSeek haya podido construir un modelo de razonamiento con los chips más antiguos y lentos de NVidia sugiere que la puerta está abierta a otros competidores, no solo en la creación de modelos de IA, sino también en la fabricación de chips.
Si como se ha dicho la IA es la nueva carrera espacial, no deberíamos dar por descontado que EE.UU. será el ganador.
Fuentes:
- La IA de DeepSeek sacude los mercados mundiales: Nvidia pierde 600.000 millones de dólares | Euronews
- https://github.com/deepseek-ai/DeepSeek-R1
- Deepseek -r1 – Modelo AI AI de razonamiento avanzado | Deepseek v3
- How DeepSeek stacks up against popular AI models, in three charts | NBC News
- El proyecto Stargate AI, a fondo: así es la apuesta de 500.000 millones de dólares del Gobierno de Trump para dominar el futuro | Forbes España
- DeepSeek: El modelo de IA chino que Supera a ChatGPT
- El modelo R1 de DeepSeek rivaliza con el o1 de OpenAI e impacta en la retención de usuarios: Barclays | Investing.com
- DeepSeek-R1: características, comparación con o1, modelos destilados y más | DataCamp
- Why Some are Calling DeepSeek’s R1 a “Sputnik Moment” — And Why Some Disagree. | The Bottom Line UCSB
- Why Chinese AI has stunned the world | The Economist

Fotografía: Rodrigo Bernardo Ortega