top of page

Razón por la que China sigue comprando las tarjetas Nvidia limitadas para entrenar sus modelos de AI


En el último año, Estados Unidos ha tomado medidas agresivas para limitar la capacidad de China de desarrollar inteligencia artificial (IA) con fines militares, bloqueando la venta en el país de los chips más avanzados utilizados para entrenar sistemas de IA.


A pesar de que los chips han sido deliberadamente limitados para el mercado chino, la tecnología estadounidense más reciente disponible en China es más potente que cualquier otra cosa. Esto ha llevado a un aumento en los pedidos chinos de los últimos procesadores avanzados de Estados Unidos. Las principales compañías de internet de China han realizado pedidos por valor de $5 mil millones USD en chips de Nvidia, cuyas unidades de procesamiento gráfico (GPU) se han convertido en el caballo de batalla para entrenar grandes modelos de IA.


El impacto de la creciente demanda global de los productos de Nvidia probablemente respaldará los resultados financieros del segundo trimestre de la compañía, que se darán a conocer el miércoles. Además de reflejar la demanda de chips mejorados para entrenar los últimos modelos de lenguaje de las compañías de internet, la prisa también ha sido provocada por la preocupación de que Estados Unidos pueda endurecer aún más sus controles de exportación, lo que haría que incluso estos productos limitados no estén disponibles en el futuro.


Bill Dally, científico jefe de Nvidia, sugirió que los controles de exportación de Estados Unidos tendrán un mayor impacto en el futuro. "A medida que los requisitos de entrenamiento para los sistemas de IA más avanzados continúen duplicándose cada seis a doce meses", dijo, "la brecha entre los chips vendidos en China y los disponibles en el resto del mundo crecerá rápidamente".

El año pasado, los controles de exportación de Estados Unidos sobre los chips incluyeron un límite en la velocidad de procesamiento máxima de los chips que se podían vender en China, así como en la velocidad a la que los chips pueden transferir datos, un factor crítico en el entrenamiento de grandes modelos de IA que requiere conectar grandes cantidades de chips entre sí.


Nvidia respondió reduciendo la velocidad de transferencia de datos en sus procesadores A100, los más avanzados en ese momento y creando un nuevo producto para China llamado A800 que cumplía con los controles de exportación.


Este año, la compañía ha seguido imponiendo límites de transferencia de datos en su procesador H100, mucho más potente y diseñado especialmente para entrenar grandes modelos de lenguaje, creando una versión llamada H800 para el mercado chino.


Nvidia no ha revelado las capacidades técnicas de los procesadores creados específicamente para China, pero los fabricantes de computadoras han sido transparentes al respecto. Por ejemplo, Lenovo anuncia servidores que contienen chips H800 que, según ellos, son idénticos en todos los sentidos a los H100 vendidos en el resto del mundo, excepto por una velocidad de transferencia de solo 400 gigabytes por segundo. Esto está por debajo del límite de 600 GB/s que Estados Unidos ha establecido para las exportaciones de chips a China. En comparación, Nvidia ha dicho que su H100, que comenzó a enviar a los clientes a principios de este año, tiene una velocidad de transferencia de 900 GB/s.


La menor velocidad de transferencia en China significa que los usuarios de los chips en ese país enfrentan tiempos de entrenamiento más largos para sus sistemas de IA en comparación con los clientes de Nvidia en otras partes del mundo, lo cual es una limitación importante a medida que los modelos crecen en tamaño.


Muchas empresas tecnológicas chinas aún se encuentran en la etapa de pre-entrenamiento de grandes modelos de lenguaje, lo cual requiere un alto rendimiento de los chips GPU individuales y una alta capacidad de transferencia de datos.


Según los ingenieros de IA chinos, solo las tarjetas de Nvidia pueden proporcionar la eficiencia necesaria para el pre-entrenamiento. Aunque las transferencias se encuentren debilitadas, el rendimiento individual de los chips de la serie 800 de Nvidia sigue siendo superior al de otros en el mercado.


"Nvidia puede parecer costoso, pero en realidad es la opción más rentable", dijo un ingeniero de IA de una importante compañía de internet china.

La empresa consideró los precios más bajos y un servicio más oportuno de otros proveedores de tarjetas GPU, pero determinó que los costos de entrenamiento y desarrollo aumentarían y que tendrían la carga adicional de la incertidumbre.


La oferta de Nvidia incluye un ecosistema de software con su plataforma de cómputo Compute Unified Device Architecture (Cuda), establecida en 2006, que se ha convertido en parte de la infraestructura de IA.


Los analistas de la industria creen que las empresas chinas pueden enfrentar limitaciones en la velocidad de interconexión entre los chips de la serie 800. Esto podría dificultar su capacidad para manejar la creciente cantidad de datos requeridos para el entrenamiento de IA y obstaculizará su investigación y desarrollo de grandes modelos de lenguaje. Charlie Chai, un analista de Shanghai en 86Research, comparó la situación con la construcción de muchas fábricas con carreteras congestionadas entre ellas. Incluso las empresas que pueden adaptarse a las limitaciones de los chips debilitados podrían enfrentar problemas en los próximos dos o tres años.


bottom of page