Microsoft sporește eficiența AI cu un „cvartet heavy metal” de compilatori - Decrypt

Microsoft sporește eficiența AI cu un „cvartet heavy metal” de compilatori – Decrypt

Nodul sursă: 2865461

Microsoft a dezvăluit o suită de patru noi compilatoare de inteligență artificială concepute pentru a optimiza performanța diferitelor modele AI. „Cvartetul de metale grele” de instrumente de compilare de ultimă oră poartă numele Rammer, Roller, Welder și Grinder.

Instrumentele au fost dezvoltate de Microsoft Research în colaborare cu o serie de instituții academice. Ele oferă soluții avansate pentru compilare — în principiu, transformarea din codul sursă (lizibil de către om) în cod de mașină (o grămadă de unități și zerouri care fac un computer executabil) — modele de IA pentru mainstream și rularea lor mai eficient pe acceleratoare hardware precum GPU-urile.

Într-o cercetare Microsoft blog evidențiind capacitățile lor, compania spune că compilatorii se bazează pe cercetarea și dezvoltarea extinsă a Microsoft în domeniul inteligenței artificiale.

„Compilatoarele AI pe care le-am dezvoltat au demonstrat o îmbunătățire substanțială a eficienței compilarii AI, facilitând astfel instruirea și implementarea modelelor AI”, a scris Jilong Xue, cercetător principal la MSR Asia. „În viitor, aceste modele la scară largă pot ajuta în mod inerent la optimizarea și compilarea.”

Cele patru noi compilatoare abordează fiecare provocări distincte în optimizarea sarcinilor de lucru AI.

Cadru se concentrează pe maximizarea paralelismului hardware - capacitatea hardware-ului de a face diferite lucruri simultan. Acesta este un factor cheie în performanță, iar Rammer minimizează overheadul de planificare a timpului de execuție prin utilizarea îmbunătățită a resurselor paralele.

Cilindru adoptă o abordare diferită pentru a accelera compilarea, folosind un algoritm de construcție rapid pentru a găsi soluții, generând în cele din urmă nuclee optimizate în câteva secunde și nu în ore. Cu alte cuvinte, Roller ajută la crearea mai rapidă a programelor de calculator eficiente pentru AI prin simplificarea procesului de proiectare.

Sudor reduce traficul costisitor de acces la memorie prin conectarea operatorilor într-o conductă concentrată. Unifică optimizările memoriei într-un singur cadru pentru o mai mare eficiență.

În cele din urmă, Polizor permite execuția fluxului de control pe acceleratoare prin integrarea acestuia cu fluxul de date. Acest lucru permite optimizarea peste limitele fluxului de control. Gândește-te la asta ca la un expert care ghidează pașii unui ucenic, spunându-i ce să facă pentru a-și duce treaba mai repede.

Fiind unul dintre cei mai mari giganți ai tehnologiei, Microsoft a fost în fruntea progresului AI. Compania a colaborat strâns cu firma de cercetare AI OpenAI pe modele mari de limbaj precum GPT-3.5 și GPT-4, care alimentează ChatGPT și Bing Chat. Mai recent, Microsoft a colaborat cu Meta pentru a integra LLaMA-2 în soluția sa de cloud computing și a introdus o tehnică numită Algoritmul Gândurilor pentru a îmbunătăți raționamentul în modele precum ChatGPT.

Testarea a constatat că compilatorii au depășit semnificativ soluțiile existente la benchmark-uri. Rammer a depășit alți compilatoare cu până la 20 de ori pe GPU-uri. Roller a egalat sau depășit performanța de ultimă generație, reducând în același timp timpul de compilare cu ordine de mărime. Welder a depășit cadrele precum PyTorch cu până la 21 de ori pe GPU. Modele accelerate de polizor cu debit de control de până la 8x.

Cvartetul de heavy metal demonstrează conducerea continuă a Microsoft în proiectarea sistemelor AI inovatoare – și în găsirea unor nume amuzante pentru produsele sale. În timp ce parteneriate mari în spațiul AI precum cel cu OpenAI prinde titluri, compania dezvoltă, de asemenea, în mod activ o infrastructură software vitală pentru a împuternici AI în culise.

Cu câștiguri considerabile de performanță față de soluțiile existente, Rammer, Roller, Welder și Grinder ar putea oferi avantaje competitive cheie pe măsură ce apar sarcini de lucru AI mai complexe.

Fiți la curent cu știrile cripto, primiți actualizări zilnice în căsuța dvs. de e-mail.

Timestamp-ul:

Mai mult de la decriptaţi