GDDR6 oferece desempenho para inferência de IA/ML

Republicado por Platão

seguidores: 0

Baixo consumo de energia - alto desempenho

OPINIÃO

A velocidade de transferência da memória e a baixa latência são essenciais à medida que a inferência muda do data center para a borda da rede.

AI/ML está evoluindo em um ritmo relâmpago. Não passa uma semana sem alguns desenvolvimentos novos e emocionantes no campo, e aplicativos como o ChatGPT trouxeram os recursos generativos de IA firmemente para o primeiro plano da atenção do público.

AI/ML consiste, na verdade, em duas aplicações: treinamento e inferência. Cada um depende do desempenho da memória e possui um conjunto exclusivo de requisitos que orientam a escolha da melhor solução de memória.

Com o treinamento, a largura de banda e a capacidade da memória são requisitos críticos. Isto é especialmente verdade devido ao tamanho e à complexidade dos modelos de dados de redes neurais que têm crescido a uma taxa de 10 vezes por ano. A precisão da rede neural depende da qualidade e quantidade de exemplos no conjunto de dados de treinamento, o que se traduz na necessidade de enormes quantidades de dados e, portanto, de largura de banda e capacidade de memória.

Dado o valor criado através do treinamento, existe um incentivo poderoso para concluir as sessões de treinamento o mais rápido possível. À medida que os aplicativos de treinamento são executados em data centers cada vez mais limitados em termos de energia e espaço, soluções que oferecem eficiência energética e tamanho menor são preferidas. Considerando todos esses requisitos, o HBM3 é uma solução de memória ideal para hardware de treinamento de IA. Ele fornece excelentes recursos de largura de banda e capacidade.

O resultado do treinamento da rede neural é um modelo de inferência que pode ser amplamente implantado. Com este modelo, um dispositivo de inferência pode processar e interpretar entradas fora dos limites dos dados de treinamento. Para inferência, a velocidade de transferência de memória e a baixa latência são essenciais, especialmente quando é necessária ação em tempo real. Com cada vez mais inferências de IA migrando do centro do data center para a borda da rede, esses recursos de memória estão se tornando ainda mais críticos.

Os designers têm várias opções de memória para inferência de AI/ML, mas no parâmetro crítico de largura de banda, a memória GDDR6 realmente brilha. Com uma taxa de dados de 24 Gigabits por segundo (Gb/s) e uma interface ampla de 32 bits, um dispositivo GDDR6 pode fornecer 96 Gigabytes por segundo (GB/s) de largura de banda de memória, mais que o dobro de qualquer DDR alternativo ou Soluções LPDDR. A memória GDDR6 oferece uma excelente combinação de velocidade, largura de banda e desempenho de latência para inferência de AI/ML, especialmente para inferência na borda.

O subsistema de interface de memória Rambus GDDR6 oferece desempenho de 24 Gb/s e é construído sobre uma base de mais de 30 anos de experiência em integridade de sinal de alta velocidade e integridade de energia (SI/PI), fundamental para operar GDDR6 em altas velocidades. Ele consiste em um controlador PHY e digital – fornecendo um subsistema completo de interface de memória GDDR6.

Junte-se a mim no webinar Rambus este mês em “Inferência de AI/ML de alto desempenho com memória 24G GDDR6” para descobrir como o GDDR6 oferece suporte aos requisitos de memória e desempenho das cargas de trabalho de inferência de AI/ML e aprender sobre algumas das principais considerações de design e implementação dos subsistemas de interface de memória GDDR6.

Recursos:

Frank Ferro

(Todas as publicações)
Frank Ferro é diretor sênior de marketing de produtos para núcleos IP da Rambus.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
Fonte: https://semiengineering.com/gddr6-delivers-the-performance-for-ai-ml-inference/

Carimbo de hora: 15 de maio de 2023

Carimbo de hora: 9 de maio de 2023

Relatório e análise anual de financiamento de startups da indústria de chips da China: 2022

Grupo de origem:

Semi Engenharia

Nó Fonte: 2022069

Carimbo de hora: 21 de março de 2023

Fluxo automatizado de ferramentas a partir de linguagens específicas de domínio para gerar aceleradores massivamente paralelos em FPGAs equipados com HBM

Grupo de origem:

Semi Engenharia

Nó Fonte: 2579585

Carimbo de hora: 12 de abril, 2023

GDDR6 oferece desempenho para inferência de IA/ML

Republicado por Platão

Frank Ferro

Mais de Semi Engenharia

Bits de pesquisa: 24 de julho

Quebrando a barreira de IOPS de gravação RAID1 de 5 milhão

Design ágil de hardware: fluxo de trabalho de verificação de equivalência totalmente automático

Uma arquitetura baseada em pacotes para inferência de IA de borda

Desafios de projeto de transmissores com fio de alta velocidade

Benchmarks de NPU BYO

GPU incorporada para FPGA, alcançando frequência operacional acima de 770 MHz com compilação irrestrita

A confiabilidade do impacto é desafiada por defeitos latentes

Desempenho da computação analógica na memória em problemas de imagem

Relatório e análise anual de financiamento de startups da indústria de chips da China: 2022

Fluxo automatizado de ferramentas a partir de linguagens específicas de domínio para gerar aceleradores massivamente paralelos em FPGAs equipados com HBM

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta