Achronix na Seleção de Plataforma para AI no Edge

Achronix na Seleção de Plataforma para AI no Edge

Nó Fonte: 1931159

Colin Alexander (Diretor de marketing de produtos da Achronix) lançou recentemente um webinar sobre este tópico. Com apenas 20 minutos, o webinar é fácil de assistir e uma atualização útil sobre tráfego de dados e opções de implementação. Os downloads ainda são dominados por vídeo (mais de 50% para o Facebook), que agora depende muito do armazenamento em cache no limite ou próximo dele. Qual destes se aplica depende da sua definição de “borda”. O mundo da IoT se vê como a borda, o mundo da nuvem e da infraestrutura aparentemente vê o último nó de computação na infraestrutura, antes desses dispositivos de folha, como a borda. Batata, potahto. Em qualquer caso, a visualização da infraestrutura da borda é onde você encontrará o cache de vídeo, para atender aos downloads mais populares da maneira mais eficiente e rápida possível.

Achronix na Seleção de Plataforma para AI no Edge

Opções de computação na borda (e na nuvem)

Colin fala inicialmente sobre a borda da infraestrutura, onde é necessária alguma potência na computação e na IA. Ele apresenta as opções padrão: CPU, GPU, ASIC ou FPGA. Uma solução baseada em CPU tem a maior flexibilidade porque sua solução será totalmente baseada em software. Pela mesma razão, geralmente também será a opção mais lenta, com maior consumo de energia e maior latência (para viagens de ida e volta aos nós de folha, presumo). As GPUs são um pouco melhores em desempenho e potência com um pouco menos de flexibilidade do que as CPUs. Um ASIC (hardware personalizado) será mais rápido, com menor consumo de energia e menor latência, embora em conceito menos flexível (todas as inteligências estão no hardware que não pode ser alterado).

Ele apresenta o FPGA (ou FPGA/eFPGA embutido) como um bom compromisso entre esses extremos. Melhor em desempenho, potência e latência do que CPU ou GPU e algo entre uma CPU e uma GPU em flexibilidade. Embora muito melhor do que um ASIC em flexibilidade porque um FPGA pode ser reprogramado. O que faz sentido para mim até onde vai, embora eu ache que a história deveria ter sido completada adicionando DSPs à linha de plataformas. Eles podem ter vantagens de hardware específicas de IA (vetorização, matrizes MAC, etc.) que beneficiam o desempenho, a potência e a latência. Mantendo a flexibilidade do software. A outra consideração importante é o custo. Este é sempre um tópico delicado, é claro, mas CPUs, GPUs e dispositivos FPGA com capacidade de IA podem ser caros, uma preocupação para a lista de materiais de um nó de borda.

O argumento de Colin faz mais sentido para mim no limite do eFPGA incorporado em um SoC maior. Em um aplicativo de nuvem, as restrições são diferentes. Uma placa de interface de rede inteligente provavelmente não é tão sensível ao preço e pode haver uma vantagem de desempenho em uma solução baseada em FPGA em comparação com uma solução baseada em software.

Oferecer suporte a aplicativos de IA na borda da computação por meio de um eFPGA parece uma opção que vale a pena investigar mais a fundo. Mais adiante, em direção aos nós das folhas, é confuso para mim. Um rastreador de logística ou um sensor de umidade do solo com certeza não hospedará computação significativa, mas e um controle remoto de TV ativado por voz? Ou um micro-ondas inteligente? Ambos precisam de IA, mas nenhum precisa de muita potência. O micro-ondas tem energia com fio, mas um controle remoto da TV ou um alto-falante inteligente remoto funciona com baterias. Seria interessante saber as compensações do eFPGA aqui.

Recursos eFPGA para IA

De acordo com a folha de dados, o Speedster 7t oferece MACs inteiros totalmente fraturáveis, ponto flutuante flexível, suporte nativo para bfloat e multiplicações de matrizes eficientes. Não consegui encontrar nenhum dado sobre TOPS ou TOPS/Watt. Tenho certeza de que depende da implementação, mas exemplos seriam úteis. Mesmo no limite, alguns aplicativos são muito sensíveis ao desempenho – vigilância inteligente e detecção de objetos voltados para a frente em carros, por exemplo. Seria interessante saber onde o eFPGA pode se encaixar em tais aplicações.

Webinar instigante. você pode assistir AQUI.

Compartilhe esta postagem via:

Carimbo de hora:

Mais de Semiwiki