09 mar. 2025

DeepSeek, resultados similares pero con dos diferencias claves: gratuidad y código abierto

Desde la aparición de ChatGPT en 2022 hay grandes expectativas sobre el impacto de la inteligencia artificial generativa, con episodios sonados como cuando OpenAI lanzó su versión mejorada, GPT-4, y ahora, con la llegada de la china DeepSeek. Pero, ¿son comparables los modelos? ¿Son muy distintas las IA en el mercado?

CHINA-TECHNOLOGY-AI-DEEPSEEK

La aplicación DeepSeek en teléfonos móviles en Hong Kong el 28 de enero de 2025 despertó los temores de un cambio radical en la fiebre del oro de la inteligencia artificial, sacudiendo a Wall Street tras la aparición de un popular modelo similar a ChatGPT procedente de China.

Foto: Mlanden Antonov (AFP).

DeepSeek lanzó su modelo R1 el pasado 20 de enero y en estas últimas horas ha liderado las listas de descargas -aunque está habiendo restricciones en el proceso de alta de nuevos usuarios por ciberataques-, revolucionando a los internautas pero también sacudiendo las bolsas de todo el mundo y abriendo las puertas a un posible cambio de las reglas del sector tecnológico.

Las claves, su código abierto, los bajos costes de su desarrollo y su eficiencia.

Así lo señala a EFE Robert Clarisó, profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC (Universitat Oberta de Catalunya), quien admite que, por las peculiaridades de este lanzamiento, “ahora todo el mundo de la IA está en estado de schock”.

Y es que, relata este experto, desde la empresa DeepSeek se ha conseguido entrenar un modelo de IA generativa muy competitivo, con un coste muy, muy inferior al que se consideraba estándar en el mercado, presentándose, además, como alternativa a ChatGPT o a Gemini (Google).

Lea más: DeepSeek, la IA china de código abierto que desafía la hegemonía estadounidense

Según la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares (5,33 millones de euros), utilizando procesadores gráficos H800 de Nvidia, una versión de capacidad reducida diseñada para el mercado chino.

Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo GPT4o de OpenAI o una vigésima parte del entrenamiento de o1, también de OpenAI. Esto, en parte, supone un cambio de paradigma porque echa por tierra esa idea de que los avances en IA requieren una cantidad ingente de recursos de cómputo, resume Clarisó.

DeepSeek se ha inspirado en el modelo o1 de OpenAI, que utiliza “chain of thought” o “cadena de pensamiento” para resolver problemas complejos, un enfoque estructurado por el que el chatbot desglosa primero las tareas y luego las ejecuta, similar al pensamiento humano.

Todo esto ha reducido los tiempos de entrenamiento y por tanto su coste. Esto sumado a la posibilidad de descargarlo y usarlo de forma gratuita -R1 puede usarse en la nube de DeepSeek a un precio inferior que sus competidores-, ha posibilitado el bum de DeepSeek-R1.

Conozca más: La IA china DeepSeek limita registros por ciberataques tras provocar un terremoto bursátil

Su código abierto es otro de sus aspectos fundamentales, cualquier persona puede examinarlo, modificarlo y adaptarlo en función de sus necesidades, incluso para evitar, fuera de China, la censura que los internautas achacan a la aplicación, añade el profesor de la UOC.

DeepSeek está publicado con la licencia MIT, que permite su uso, copia, modificación y venta.

DeepSeek-R1 ha sido entrenada en inglés y chino y su rendimiento se puede comparar con el modelo o1 de OpenAI -con la que la propia empresa hace su comparativa- o Claude, de Anthropic. Todas ellas usan el enfoque de “cadena de pensamiento” por defecto.

En la resolución de problemas matemáticos, programación e inferencia del lenguaje natural los resultados son muy parecidos, así que las diferencias, insiste Clarisó, están en los costes y en estar publicado como código abierto.

El experto de la UOC, quien recuerda a los usuarios que al utilizar la aplicación de DeepSeek dan permiso a la empresa para monitorizar las búsquedas y usarlas en el futuro para entrenar nuevos modelos, opina que su explosión no hubiese sido tanta en otro momento y con otro origen.

Es decir, la coincidencia con la llegada de Donald Trump al Gobierno de Estados Unidos, el anuncio de su proyecto ‘Stargate’ -con 500 millones de dólares para IA- y el hecho de que la aplicación sea china, desafiando la hegemonía estadounidense en este campo, tiene mucho que ver, concluye el experto en informática.

Ciberataques a nivel global

Los ataques maliciosos pueden tener distintos significados, según Kaspersky.

Marc Rivero, de esta compañía, explica que en este caso, DeepSeek ha limitado el registro de nuevos usuarios, por lo que es probable que se trate de un ataque de denegación de servicio distribuido (DDoS), en el que los servidores son saturados con tráfico masivo con el objetivo de interrumpir su funcionamiento.

Pero también podrían ser intentos masivos de acceso no autorizado o explotación de vulnerabilidades. Sin embargo, “es complicado” asegurar su naturaleza hasta que DeepSeek comparta más detalles técnicos, afirma en un comunicado.

Según Kaspersky, lo que destaca en el caso de DeepSeek es su carácter de código abierto, “un arma de doble filo”.

Sepa más: Trump cree que el éxito de DeepSeek es una llamada de atención para empresas de EEUU

“Si bien los marcos de software de código abierto fomentan la transparencia, colaboración e innovación, también conllevan riesgos de seguridad y dilemas éticos”. De hecho, en 2024, el escáner de código abierto de Kaspersky detectó más de 12.000 paquetes maliciosos en repositorios abiertos.

Sin una supervisión centralizada, los ciberdelincuentes pueden empezar a crear versiones comprometidas del software o introducir puertas traseras bajo la apariencia de herramientas para usar la API de DeepSeek, lo que representa graves riesgos para usuarios y organizaciones.

Además, buscan explotar este tipo de herramientas con fines maliciosos, lo que ya se ha observado con otros modelos de IA populares, que se han utilizado para actividades como la creación de correos electrónicos de ‘phishing’.

Fuente: EFE.

Más contenido de esta sección
El papa Francisco siguió este domingo por videoconferencia desde el Hospital Gemelli de Roma los ejercicios espirituales de la curia romana en el Vaticano, en su vigésimo cuarto día ingresado por sus problemas respiratorios.
El intendente de la ciudad argentina de Bahía Blanca, Federico Susbielles, confirmó este domingo que ascendió a 15 el número de personas fallecidas por las inundaciones provocadas por intensas lluvias durante la madrugada del viernes.
Un grupo de vecinos repudió a la ministra de Seguridad Nacional, Patricia Bullrich, y al ministro de Defensa, Luis Petri, durante su visita a Bahía Blanca, ciudad de la provincia de Buenos Aires devastada por inundaciones que hasta el momento registra 13 víctimas fatales.
Hace cinco años, el mundo reaccionó con medidas sin precedentes para tratar de frenar la pandemia del Covid-19, desde las duras restricciones en China, que se alargaron hasta el 2023, hasta los largos confinamientos como el de Buenos Aires, que duró más de 240 días.
Taiwán mantendrá su liderazgo global en la fabricación de chips pese a la expansión de TSMC en Estados Unidos, según expertos, quienes interpretan la inversión de 100.000 millones de dólares de la tecnológica en el país norteamericano como un gesto de buena voluntad hacia Donald Trump.
Miles de mujeres se tomaron este sábado las calles de las principales ciudades de Latinoamérica en conmemoración por el Día Internacional de la Mujer, así como para visibilizar la lucha por la igualdad de género y exigir la erradicación de la violencia machista.