DeepSeek y la Inteligencia Artificial

Michael Roberts

La mayoría de los lectores ya conocerán las noticias. DeepSeek, una empresa china de IA, ha lanzado un modelo de IA llamado R1 que es comparable en capacidad a los mejores modelos de empresas como OpenAI, Anthropoc y Meta, pero fue entrenado a un coste radicalmente menor y utilizando chips de GPU que no eran de última generación. DeepSeek también ha hecho públicos suficientes detalles de su modelo como para que otros puedan ejecutarlo en sus propios ordenadores sin cargo.

Modelo R1 de DeepSeek alcanza 671 mil millones de parámetros tras 2.8 millones de horas de GPU
Modelo R1 de DeepSeek alcanza 671 mil millones de parámetros tras 2.8 millones de horas de GPU

DeepSeek es un torpedo que ha golpeado a los “Siete Magníficos, las grandes empresas estadounidenses de alta tecnología, por debajo de la línea de flotación. DeepSeek no ha utilizado los mejores chips y software más moderno de Nvidia; no ha necesitado una gran inversión para entrenar su modelo de IA a diferencia de sus rivales estadounidenses; y ofrece tantas aplicaciones útiles como ellos.

DeepSeek construyó su R1 con los chips más antiguos y lentos de Nvidia, que las sanciones de Estados Unidos permiten exportar a China. El gobierno de los Estados Unidos y los titanes de la tecnología pensaban que tenían el monopolio del desarrollo de la IA debido a los enormes costes involucrados en la fabricación de mejores chips y modelos de IA. Pero ahora el R1 de DeepSeek sugiere que las empresas con menos dinero pronto pueden operar modelos competitivos de IA. R1 se puede utilizar con un presupuesto ajustado y con mucha menos potencia informática. Además, R1 es tan bueno como sus rivales en “inferencia”, que en la jerga de la IA es cuando los usuarios preguntan al modelo y obtienen respuestas. Y funciona en servidores, para todo tipo de empresas no necesiten “alquilarlo” a precios enormes a empresas como OpenAI.

Lo más importante es que el R1 de DeepSeek es de “código abierto”, es decir, que sus métodos de codificación y entrenamiento están abiertos a todos para copiar y desarrollar. Este es el verdadero golpe a los secretos de “propiedad” que OpenAI o Gemini de Google encierran en una “caja negra” para maximizar sus ganancias. La analogía son los productos farmacéuticos de marca y genéricos.

El gran problema para las empresas de IA de EEUU y sus inversores es que parece que la construcción de enormes centros de datos para albergar múltiplos de chips costosos puede no ser necesaria para lograr resultados que sean suficientemente satisfactorios. Hasta ahora, las empresas estadounidenses han estado haciendo enormes planes de gasto y tratando de recaudar grandes cantidades de financiación para ellos. De hecho, el mismo lunes en que R1 de DeepSeek fue noticia, Meta anunció otros 65 mil millones de dólares de inversión, y solo unos días antes el presidente Trump anunció subsidios gubernamentales de 500 mil millones de dólares a los gigantes tecnológicos como parte del llamado proyecto Stargate. Irónicamente, el director ejecutivo de Meta, Mark Zuckerberg, dijo que estaba invirtiendo porque “queremos que Estados Unidos establezca el estándar global de IA, no China”. ¡Qué pena!

Ahora a los inversores les preocupa que este gasto sea innecesario y, más al punto, que la rentabilidad de las empresas estadounidensesse vea afectada si DeepSeek puede ofrecer aplicaciones de IA a una décima parte del coste. Cinco de las mayores acciones tecnológicas orientadas a la IA, el fabricante de chips Nvidia y los llamados “hiperescaladores” Alphabet, Amazon, Microsoft y Meta Platforms, perdieron colectivamente casi 750 mil millones de dólares de su valor bursátil en un día. Y DeepSeek amenaza las ganancias de las empresas de centros de datos y de los operadores de agua y energía que esperan beneficiarse de la enorme “escalada” de los Siete Magníficos. El auge del mercado de valores estadounidense se concentra en gran medida en los “Siete Magníficos”.

¿Ha pinchado DeepSeek la enorme burbuja en el mercado de valores de las acciones tecnológicas de EEUU? El inversor multimillonario Ray Dalio cree que sí. Le dijo al Financial Times que “los precios han llegado a niveles que son altos al mismo tiempo que hay un riesgo con la tasa de interés, y esa combinación podría pinchar la burbuja… la situación en el ciclo en este momento es muy similar a donde estábamos entre 1998 o 1999″, según Dalio. “En otras palabras, hay una nueva tecnología importante que sin duda cambiará el mundo y tendrá éxito. Pero algunas personas están confundiendolo con el éxito de las inversiones en ella”.

Pero puede que ese no sea el caso, al menos no todavía. El precio de las acciones de la empresa de chips de IA Nvidia puede haber caído esta semana, pero el lenguaje de codificación del que es “propietaria”, Cuda, sigue siendo el estándar de la industria estadounidense. Mientras que sus acciones cayeron casi un 17 %, eso solo la devuelve al (muy, muy alto) nivel de septiembre.

Mucho dependerá de otros factores como lo Reserva Federal de EEUU mantenga altas tasas de interés debido a una reversión en la caída de la inflai´ción y de si Trump avanza a lo grande con sus amenazas arancelarias y a los inmigrantes, que sólo alimentarán la inflación.

Lo que debe enfurecer a los oligarcas tecnológicos que bailan alrededor de Trump es que las sanciones de Estados Unidos a las empresas chinas y las prohibiciones de exportaciones de chips no han impedido que China avance aún más en la guerra de tecnología y chips con Estados Unidos. China está logrando dar saltos tecnológicos en la IA a pesar de los controles de exportación introducidos por la administración Biden, destinados a privarla tanto de los chips más potentes como de las herramientas avanzadas necesarias para hacerlos.

El campeón tecnológico chino Huawei se ha convertido en el principal competidor de Nvidia en China para los chips de “inferencia”. Y ha estado trabajando con empresas de IA, incluyendo DeepSeek, para adaptar modelos entrenados en GPUs de Nvidia para ejecutar inferencias en sus chips Ascend. “Huawei está mejorando. Tienen una oportunidad, ya que el gobierno está diciendo a las grandes empresas tecnológicas que necesitan comprar sus chips y usarlos para inferencia”, dijo un inversor de semiconductores en Beijing.

Esta es una demostración más de que la inversión planificada liderada por el estado en tecnología y capacidad tecnológica por parte de China funciona mucho mejor que confiar en enormes gigantes tecnológicos privados liderados por magnates. Como dijo Ray Dallo: “En nuestro sistema, en general, nos estamos moviendo hacia un tipo de política más compleja industrialmente en . Sin embargo, los titanes de la IA aún no son el Titanic. Están aumentando su apuesta al invertir más y más miles de millones en centros de datos y chips más avanzados. Esto está consumiendo energía informática exponencialmente.

Y, por supuesto, no hay la menor toma en consideración de lo que a los economistas convencionales les gusta llamar cortésmente “externalidades”. Según un informe de Goldman Sachs, una consulta de ChatGPT necesita casi 10 veces más electricidad que una consulta de búsqueda de Google. El investigador Jesse Dodge hizo algunos cálculos sobre la cantidad de energía que utilizan los chatbots de IA. “Una consulta a ChatGPT utiliza aproximadamente tanta electricidad como podría encender una bombilla durante unos 20 minutos”, dice. “Si pensamos en millones de personas usando algo así todos los días, eso suma una gran cantidad de electricidad”. Un mayor consumo de electricidad significa más producción de energía y, en particular, más emisiones de gases de efecto invernadero de combustibles fósiles.

Google tiene el objetivo de alcanzar cero emisiones netas para 2030. Desde 2007, la compañía ha dicho que las operaciones de su empresa eran neutras en carbono debido a las compensaciones de carbono que compra para igualar sus emisiones. Pero, a partir de 2023, Google escribió en su informe de sostenibilidad que ya no estaba “manteniendo la neutralidad de carbono operativa”. La compañía dice que todavía mantiene su objetivo neto de cero en 2030. “La verdadera motivación de Google es construir los mejores sistemas de inteligencia artificial que puedan”, dice Dodge. Y están dispuestos a invertir una tonelada de recursos en eso, incluyendo cosas como entrenar sistemas de IA en centros de datos cada vez más grandes, incluidas supercomputadoras, lo que incurre en una tremenda cantidad de consumo de electricidad y, por lo tanto, en emisiones de CO2″.

Además está el agua. Mientras Estados Unidos se enfrenta a sequías e incendios forestales, las empresas de IA están absorbiendo aguas profundas para “enfriar” su megacentros de datos para proteger los chips. Más que eso, las empresas de Silicon Valley están tomando cada vez más el control de la infraestructura de suministro de agua para satisfacer sus necesidades. La investigación sugiere, por ejemplo, que se podrían haber utilizado alrededor de 700.000 litros de agua para enfriar las máquinas que entrenaron a ChatGPT-3 en las instalaciones de datos de Microsoft. Los modelos de IA de entrenamiento consumen 6.000 veces más energía que una ciudad europea. Además, aunque los minerales como el litio y el cobalto se asocian comúnmente con las baterías en el sector del automóvil, también son cruciales para las baterías utilizadas en los centros de datos. El proceso de extracción a menudo implica un uso significativo del agua y puede conducir a la contaminación, socavando la seguridad hídrica.

Sal Altman, el anterior héroe sin fines de lucro de Open AI, pero ahora dispuesto a maximizar las ganancias de Microsoft, argumenta que sí, desafortunadamente hay “desventajas” a corto plazo, pero son necesarias para llegar a la llamada AGI; y luego la AGI nos ayudará a resolver todos estos problemas para que el intercambio de “externalidades” valga la pena.

¿AGI? ¿Qué es eso?

La inteligencia artificial generalizada (AGI) es el santo grial de los desarrolladores de IA. Significa que los modelos de IA se volverían “superinteligentes”, muy por encima de la inteligencia humana. Cuando eso se logre, promete Altman, su IA no solo podrá hacer el trabajo de un solo trabajador, sino que podrá hacer todos sus trabajos: “La IA puede hacer el trabajo de una organización”. Esto sería lo más para maximizar la rentabilidad al deshacerse de los trabajadores en las empresas (¿incluso las empresas de IA?) a medida que las máquinas de IA se hacen cargo de la operación, el desarrollo y la comercialización de todo. Este es el sueño apocalíptico del capital (pero una pesadilla para el trabajo: ni empleo, ni ingresos).Artificial General Intelligence: Is AGI Really Coming by 2025? - Hyperight

Por eso Altman y los otros magnates de la IA no dejarán de expandir sus centros de datos y desarrollar chips aún más avanzados a pesar de que DeepSeek haya socavado sus modelos actuales. La firma de investigación Rosenblatt pronostica la respuesta de los gigantes tecnológicos: “En general, esperamos que la tendencia sea mejorar la capacidad, avanzando más rápido hacia la inteligencia artificial generalizada, en vez de reducir el gasto”. Nada debe detener el objetivo de la IA superinteligente.

Algunos ven la carrera por lograr la AGI como una amenaza para la propia humanidad. Stuart Russell, profesor de informática en la Universidad de California, Berkeley, escribe: “Incluso los directores ejecutivos que participan en la carrera han declarado que quien gane tiene una probabilidad significativa de causar la extinción humana en el proceso, porque no tenemos idea de cómo controlar sistemas más inteligentes que nosotros mismos (…) En otras palabras, la carrera por la AGI es una carrera hacia el borde de un acantilado”.

Tal vez, pero sigo dudando de que la “inteligencia” humana pueda ser reemplazada por la inteligencia de las máquinas, principalmente porque son diferentes. Las máquinas no pueden pensar en cambios potenciales y cualitativos. El nuevo conocimiento proviene de tales transformaciones (humanas), no de la extensión del conocimiento existente (máquinas). Solo la inteligencia humana es social y puede ver el potencial de cambio, en particular el cambio social, que conduce a una vida mejor para la humanidad y la naturaleza.

Lo que la aparición de DeepSeek ha demostrado es que la IA se puede desarrollar a un nivel que ayude a la humanidad y a sus necesidades sociales. Su modelo es gratuito y abierto y está disponible para el usuario y desarrollador más pequeño. No se ha desarrollado con fines de lucro o para obtener ganancias. Como dijo un comentarista: “Quiero que la IA lave mi ropa y mis platos para que pueda hacer arte y escribir, no que la IA haga mi arte y escriba por mi para que yo pueda lavar mi ropa y mis platos”. Los gerentes están introduciendo la IA para “facilitar los problemas de gestión a costa de cosas para las que muchas personas no creen que la IA deba usarse, como el trabajo creativo… Si la IA va a funcionar, tiene que venir de abajo hacia arriba, o la IA va a ser inútil para la gran mayoría de las personas en el lugar de trabajo”.

En lugar de desarrollar IA para obtener ganancias, reducir los empleos y los medios de vida de los humanos, la IA bajo la propiedad y la planificación comunes podría reducir las horas de trabajo humano para todos y liberar a los humanos del trabajo para concentrarse en el trabajo creativo que solo la inteligencia humana puede ofrecer. Recuerde que el “santo grial” fue un mito victoriano, utilizado más tarde también por Dan Brown.

* Economista marxista británico, que ha trabajado 30 años en la City londinense como analista económico y publica el blog The Next Recession.