Les géants chinois du Web se lancent dans une virée shopping de 5 milliards de dollars avec Nvidia AI

Les géants chinois du Web se lancent dans une virée shopping de 5 milliards de dollars avec Nvidia AI

Nœud source: 2816928

Les plus grands fournisseurs Web et cloud de Chine font la queue pour acheter autant de GPU Nvidia qu'ils le peuvent tant qu'ils peuvent encore mettre la main dessus.

Alors que la Maison Blanche annonçait de nouvelles restrictions sur les investissements technologiques américains dans l'Empire du Milieu, un rapport a été publié réclame qu'Alibaba, Baidu, ByteDance et Tencent ont commandé collectivement 100,000 800 GPU Nvidia A1 d'une valeur d'environ XNUMX milliard de dollars. UN version nerfée de l'A100 de Nv, maintenant âgé de trois ans, l'A800 a été développé pour contourner les limites de performances sur l'exportation des accélérateurs américains d'IA vers la Chine.

Citant "des personnes familières avec le sujet", le rapport ajoute que ces mêmes entreprises ont acheté pour 4 milliards de dollars supplémentaires de GPU pour livraison l'année prochaine. Cependant, à ce stade, il n'est pas clair quelles cartes ils essaient d'obtenir. Si nous devions deviner, les nouveaux GPU Hopper de Nvidia, comme le H800 aux spécifications chinoises ou potentiellement la génération de GPU Ada Lovelace de la société américaine.

Sans ces puces, a déclaré un employé de Baidu, le géant du Web ne serait pas en mesure de former de grands modèles de langage substantiels. Les LLM, y compris les séries GPT-4 d'OpenAI, Falcon-40B de TII et Llama de Meta, sont la pierre angulaire de l'IA générative. Plusieurs organisations chinoises sont en train de développement leurs propres LLM pour alimenter des services concurrents.

Restrictions américaines à l'exportation mis en œuvre l'année dernière a imposé des limites sur la bande passante IO à pas plus de 600 Go / s pour les accélérateurs d'IA vendus aux pays préoccupants. Ces limitations visaient à entraver les performances des accélérateurs lorsqu'ils sont mis en réseau, limitant leur utilité pour les charges de travail d'IA à paramètres élevés.

La décision a brièvement interdit à Nvidia, AMD et Intel de vendre leur dernière génération de GPU et d'accélérateurs en Chine. Cependant, dans les mois qui ont suivi, et avec le battage médiatique autour de l'IA générative, les fabricants de puces ont travaillé pour moderniser les cartes existantes afin de se conformer aux règles. Nvidia a été parmi les premiers à le faire avec l'A800 susmentionné, qui a réduit de moitié la mémoire et réduit la bande passante d'interconnexion aux deux tiers.

Plus récemment, Intel annoncé une version spécifique à la Chine de son accélérateur Guadi2 AI à vendre en Chine, tandis qu'AMD, lors de son dernier appel aux résultats, indiqué il travaillait sur un GPU conforme aux lois américaines sur l'exportation pour le marché chinois.

Les législateurs américains sont pressant pour des restrictions plus strictes sur l'exportation d'accélérateurs d'IA vers la Chine, certains suggérant que les plafonds de performance devraient être encore plus bas.

Les puces chinoises entièrement locales capables de remplacer le silicium fabriqué ou développé aux États-Unis restent insaisissables. Comme nous rapporté plus tôt cette semaine, le chinois Loongson, une société leader dans le développement d'un processeur local, a des années de retard sur Intel en termes de performances. Et Alibaba Cloud aime parler son processeur Yitian 128 de classe serveur à 710 cœurs, mais gardez à l'esprit que ces cœurs ont été concédés sous licence par Arm.

Alors que les GPU reçoivent beaucoup d'attention pour leur rôle dans la formation à l'IA, les processeurs jouent toujours un rôle dans l'inférence ainsi que dans la formation.

Le développement du GPU chinois a également été entravé par les restrictions sur la propriété intellectuelle américaine utilisées par les principaux opérateurs de fonderie. Biren Technology, un fabricant de puces chinois sans usine développant un GPU de centre de données fabriqué par TSMC, a été forcé de refactoriser sa conception pour respecter les mêmes restrictions d'interconnexion de 600 Go/s que les fabricants de puces américains, par exemple.

Il y a des signes que l'administration Biden recherche des mesures supplémentaires pour non seulement limiter l'accès chinois aux puces américaines, mais également le financement. En plus d'une période de dix ans interdire sur les développements chinois pour ceux qui profitent des 39 milliards de dollars de financement US CHIPS, le président Joe Biden mercredi signé un décret exécutif restreignant les investissements américains dans les entreprises chinoises développant certaines technologies préoccupantes.

L'ordonnance vise à empêcher les investisseurs américains de soutenir le développement des technologies chinoises d'informatique quantique, de mise en réseau et d'intelligence artificielle à des fins militaires et de collecte de renseignements. ®

Horodatage:

Plus de Le registre