I giganti cinesi del web vanno a fare spese folli per Nvidia AI da 5 miliardi di dollari

I giganti cinesi del web vanno a fare spese folli per Nvidia AI da 5 miliardi di dollari

Nodo di origine: 2816928

I più grandi fornitori di servizi web e cloud della Cina si stanno mettendo in fila per acquistare quante più GPU Nvidia possibile finché possono ancora metterci le mani sopra.

Proprio mentre la Casa Bianca annunciava nuove restrizioni agli investimenti tecnologici statunitensi nel Regno di Mezzo, è emerso un rapporto sostenendo che Alibaba, Baidu, ByteDance e Tencent hanno ordinato collettivamente 100,000 GPU Nvidia A800 per un valore di circa 1 miliardo di dollari. UN versione nerfata dell'A100 di Nv, che ha ormai tre anni, l'A800 è stato sviluppato per aggirare i limiti di prestazione sull'esportazione di acceleratori di intelligenza artificiale americani in Cina.

Citando "persone che hanno familiarità con la questione", il rapporto aggiunge che queste stesse aziende hanno acquistato altri 4 miliardi di dollari di GPU per la consegna il prossimo anno. Tuttavia, a questo punto, non è chiaro quali carte stiano cercando di ottenere. Se dovessimo indovinare, le nuove GPU Hopper di Nvidia, come l'H800 con specifiche cinesi o potenzialmente la generazione di GPU Ada Lovelace della società statunitense.

Senza questi chip, ha affermato un dipendente di Baidu, il gigante del web non sarebbe in grado di addestrare modelli linguistici sostanziali di grandi dimensioni. Gli LLM, tra cui GPT-4 di OpenAI, Falcon-40B di TII e la serie Llama di Meta, sono la linfa vitale dell'IA generativa. Molte delle organizzazioni cinesi sono in procinto di in via di sviluppo i propri LLM per alimentare servizi concorrenti.

Restrizioni all'esportazione negli Stati Uniti implementato lo scorso anno ha imposto limiti alla larghezza di banda IO a non più di 600 GB/sec per gli acceleratori AI venduti ai paesi preoccupanti. Queste limitazioni avevano lo scopo di ostacolare le prestazioni degli acceleratori quando collegati in rete, limitando la loro utilità per i carichi di lavoro IA ricchi di parametri.

La sentenza ha impedito brevemente a Nvidia, AMD e Intel di vendere la loro ultima generazione di GPU e acceleratori in Cina. Tuttavia, nei mesi successivi, e con la crescita dell'entusiasmo per l'IA generativa, i produttori di chip hanno lavorato per adattare le schede esistenti per conformarsi alle regole. Nvidia è stata tra le prime a farlo con il già citato A800, che ha dimezzato la memoria e ridotto a due terzi la larghezza di banda di interconnessione.

Più recentemente, Intel ha annunciato una versione specifica per la Cina del suo acceleratore AI Guadi2 in vendita in Cina, mentre AMD, durante la sua ultima chiamata sugli utili, indicato stava lavorando su una GPU conforme alle leggi statunitensi sull'esportazione per il mercato cinese.

I legislatori statunitensi lo sono premendo per restrizioni più rigide sull'esportazione di acceleratori di intelligenza artificiale in Cina, con alcuni che suggeriscono che i limiti di prestazione dovrebbero essere fissati ancora più in basso.

I chip cinesi completamente nostrani in grado di sostituire il silicio prodotto o sviluppato negli Stati Uniti rimangono sfuggenti. Come noi segnalati all'inizio di questa settimana, la cinese Loongson, un'azienda leader nello sviluppo di una CPU nostrana, è indietro di anni rispetto a Intel in termini di prestazioni. E ad Alibaba Cloud piace parla il suo processore Yitian 128 di classe server da 710 CPU, anche se tieni presente che quei core sono stati concessi in licenza da Arm.

Mentre le GPU ricevono molta attenzione per il loro ruolo nell'addestramento dell'IA, le CPU svolgono ancora un ruolo nell'inferenza e nell'addestramento.

Lo sviluppo della GPU cinese è stato anche ostacolato dalle restrizioni sulla proprietà intellettuale statunitense utilizzata dai principali operatori di fonderia. Biren Technology, un favoloso produttore di chip cinese che sviluppa una GPU per data center progettata da TSMC, lo era forzato per rifattorizzare il suo design per rispettare le stesse restrizioni di interconnessione di 600 GB/s dei produttori di chip statunitensi, ad esempio.

Ci sono segnali che l'amministrazione Biden stia cercando misure aggiuntive non solo per frenare l'accesso cinese ai chip americani, ma anche per i finanziamenti. Oltre a un decennale bandire sugli sviluppi cinesi per coloro che si avvalgono dei 39 miliardi di dollari di finanziamenti CHIPS statunitensi, il presidente Joe Biden mercoledì firmato un ordine esecutivo che limita gli investimenti statunitensi nelle società cinesi che sviluppano determinate tecnologie preoccupanti.

L'ordine cerca di evitare che gli investitori statunitensi sostengano lo sviluppo delle tecnologie cinesi di calcolo quantistico, networking e intelligenza artificiale con usi militari e di raccolta di informazioni. ®

Timestamp:

Di più da Il registro