Desde que OpenAI presentó ChatGPT, la startup que dirige Sam Altman lideró la carrera por la inteligencia artificial. Y otros gigantes de Silicon Valley también presentaron desarrollos que lo posicionaron entre lo más alto. Sin embargo, este reinado se está viendo amenazado por la llegada de DeepSeek, una herramienta de IA de origen chino que ya provocó que bajarán las acciones de esta tecnología en Wall Street.
DeepSeek es una startup que tiene su sede en Hangzhou, China, y que se presentó en el sector de la IA con un modelo poderoso que pone en jaque el liderazgo de OpenAI y de Anthropic, la compañía detrás de Claude. Su ventaja más innovadora es que logró desarrollar una tecnología con muchas capacidades por un costo considerablemente menor al de sus competidoras.
En qué consiste DeepSeek, la IA china que revoluciona el mercado
La propuesta de la compañía asiática se basa en la reducción de costos y en la potencia de su servicio. La principal diferencia, la que lo separa de OpenAI, es que el entrenamiento de los modelos de inteligencia artificial que usa ChatGPT (GPT-4) implica una inversión que supera los 100 millones de dólares, además de GPU de alta gama para su desarrollo y aprendizaje, mientras que sus sistemas son mucho más baratos.
De acuerdo a lo que explicaron los desarrolladores de la empresa china, el modelo DeepSeek V3 fue entrenado por solo 6 millones de dólares a partir de los chips de Nvidia 800. Se trata de un hardware que fue diseñado para ser una alternativa limitada de las sanciones de Estados Unidos ante el país asiático pero alcanzó una performance más alta de la inesperada.
Una de sus características más innovadoras es que tiene menos requisitos para operar, aunque lo hace a partir de un sistema que optimiza sus habilidades. Los grandes modelos de IA suelen activar 1,8 billones de parámetros tradicionales, mientras que DeepSeek solo aplica 37 mil millones de parámetros activos en simultáneo.
El total que conforma su sistema es de 671 mil millones. Como consecuencia de este cambio, se reducen sus necesidades de memoria y hardware, lo que genera que puedan funcionar con GPU convencionales. Su mayor beneficio es que no dependen de manera exclusiva de los centros de datos, que demandan mucha energía y un mantenimiento sumamente costoso.
Por otra parte, los ingenieros de DeepSeak lograron implementar un sistema avanzado para procesar frases completas, al que denominaron multi-token. Esto es otra diferencia con las herramientas generales, que lo hacen palabra por palabra. La gran ventaja detrás de esta estrategia es que acelera el análisis de grandes volúmenes de datos, aunque puede ser menos precisa en determinados contextos.
Por qué DeepSeek causó un gran revuelo en Estados Unidos
El impacto de la presentación del modelo DeepSeek R1 encendió las alarmas dentro de Silicon Valley y en Wall Street, ya que las acciones del sector cayeron a valores mínimos. El impacto en el mercado tecnológico fue abrupto. Y esto se debe a que el sistema puede ofrecer una solución de IA de bajo costo, a diferencia de ChatGPT o Claude, las más poderosas.
Por ejemplo, Nvidia sufrió pérdidas del 10% en el valor de la compañía, mientras que los números de Oracle cayeron en un 8%. Esto no es un dato menor considerando que se trata de empresas valuadas en billones de dólares. Y todo eso ocurrió en un solo día. Algo similar ocurrió en Japón, ya que Softbank Group, inversor en startup, reportó un descenso del 8%.
Una de las principales razones detrás del impacto que generó la presentación de R1 por DeepSeak se debe a que los inversores comenzaron a tener dudas sobre los modelos de negocio de las compañías más importantes que desarrollan inteligencia artificial. De hecho, esto podría generar que las empresas de Silicon Valley cambien su estrategia, principalmente en cuanto al costo de sus actividades.
En el caso de Nvidia, que logró convertirse en una de las cinco compañías más valiosas del mundo gracias a los chips que fabrica y abastece a las empresas que desarrollan IA, la aparición de DeepSeek R1 podría provocar que se reduzcan las demandas de sus GPU de alta gama, los que utilizan entidades como OpenAI o Microsoft.
Cuáles son las preocupaciones que genera DeepSeek
Más allá del entusiasmo que provocó la presentación de este modelo, en algunos lugares surgieron dudas sobre la privacidad de los datos de los usuarios. De hecho, la acusaron de un posible uso indebido de la información que se almacena en servidores chinos. La mayor preocupación está vinculada a la ciberseguridad y a lo que se puede realizar a partir de esta tecnología.
Algunos expertos consideran que China está usando DeepSeek como un caballo de troya para recopilar información sobre los usuarios a partir de este modelo de inteligencia artificial, algo que puede ocurrir de manera accidental. Esto es porque las condiciones de uso de la compañía no poseen restricciones sobre lo que R1 es capaz de hacer con las solicitudes que envían los usuarios.
De esta manera, tanto los individuos como las empresas podrían estar en riesgo si comparten información confidencial con el sistema. Su política de privacidad también destaca que la información personal que recopila la IA de los usuarios puede llegar a ser almacenada en servidores que se encuentran en un país distinto al que vive el internauta.
Luego también indican que almacenan los datos en servidores seguros que se localizan en China. Y esto es lo que aterra a los opositores de DeepSeek, ya que no se sabe qué se realiza con esa información obtenida. El principal miedo es que sea aplicada como herramienta de ciberespionaje, algo que en Estados Unidos ya fue debatido cuando se pretendió cerrar TikTok, del mismo origen que esta IA.