Microsoft aumenta a eficiência da IA ​​com um 'quarteto de heavy metal' de compiladores

Microsoft aumenta a eficiência da IA ​​com um 'quarteto de heavy metal' de compiladores

Nó Fonte: 2865461

A Microsoft revelou um conjunto de quatro novos compiladores de inteligência artificial projetados para otimizar o desempenho de vários modelos de IA. O “quarteto de heavy metal” de ferramentas de compilação de ponta leva os nomes Rammer, Roller, Welder e Grinder.

As ferramentas foram desenvolvidas pela Microsoft Research em colaboração com diversas instituições acadêmicas. Eles fornecem soluções avançadas para compilar – basicamente a transformação do código-fonte (legível por humanos) em código de máquina (um monte de uns e zeros que tornam um computador executável) – modelos convencionais de IA e executá-los com mais eficiência em aceleradores de hardware como GPUs.

In a Microsoft Research no blog highlighting their capabilities, the company says the compilers build on Microsoft’s extensive research and development in artificial intelligence.

“Os compiladores de IA que desenvolvemos demonstraram uma melhoria substancial na eficiência da compilação de IA, facilitando assim o treinamento e implantação de modelos de IA”, escreveu Jilong Xue, pesquisador principal da MSR Ásia. “No futuro, esses próprios modelos em grande escala poderão ajudar inerentemente a alcançar a otimização e a compilação.”

Cada um dos quatro novos compiladores enfrenta desafios distintos na otimização de cargas de trabalho de IA.

Estrutura focuses on maximizing hardware parallelism—the capacity of hardware to do different things simoultaneously. This is a key factor in performance, and Rammer minimizes runtime scheduling overhead through improved utilization of parallel resources.

Patinete takes a different approach to accelerate compilation, using a fast construction algorithm to find solutions, ultimately generating optimized kernels in seconds rather than hours. In other words, Roller helps create efficient computer programs for AI faster by simplifying the design process.

Soldador reduces expensive memory access traffic by connecting operators in a concentrated pipeline. It unifies memory optimizations into a single framework for greater efficiency.

Finalmente, Amolador enables control-flow execution on accelerators by integrating it with data flow. This allows optimization across control flow boundaries. Think of it like an expert guiding the steps of an apprentice, telling them what to do to get the job done faster.

As one of the leading technology giants, Microsoft has been at the forefront of AI advancement. The company has partnered closely with AI research firm OpenAI on large language models like GPT-3.5 and GPT-4, which powers ChatGPT and Bing Chat. More recently, Microsoft parceria com Meta to integrate LLaMA-2 in its cloud computing solution and introduced a technique called the Algoritmo de Pensamentos to enhance reasoning in models like ChatGPT.

Os testes revelaram que os compiladores superaram significativamente as soluções existentes em benchmarks. Rammer superou outros compiladores em até 20x em GPUs. O Roller igualou ou excedeu o desempenho de última geração, ao mesmo tempo que reduziu o tempo de compilação em ordens de magnitude. O Welder ultrapassou frameworks como PyTorch em até 21x em GPUs. Modelos acelerados de moedor com controle de vazão em até 8x.

The heavy metal quartet demonstrates Microsoft’s continued leadership in designing breakthrough AI systems —and coming up with fun names for its products. While big partnerships in the AI space like the one with OpenAI grab headlines, the company also actively develops vital software infrastructure to empower AI behind the scenes.

Com ganhos consideráveis ​​de desempenho em relação às soluções existentes, Rammer, Roller, Welder e Grinder podem fornecer vantagens competitivas importantes à medida que surgem cargas de trabalho de IA mais complexas.

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.

Carimbo de hora:

Mais de Descifrar