Achronix over platformselectie voor AI aan de rand

Achronix over platformselectie voor AI aan de rand

Bronknooppunt: 1931159

Colin Alexander (directeur productmarketing bij Achronix) heeft onlangs een webinar over dit onderwerp uitgebracht. Met slechts 20 minuten is het webinar een easy watch en een handige update over dataverkeer en implementatiemogelijkheden. Downloads worden nog steeds gedomineerd door video (meer dan 50% voor Facebook) die nu sterk afhankelijk is van caching aan of dichtbij de edge. Welke van deze van toepassing is, hangt af van uw definitie van "rand". De IoT-wereld ziet zichzelf als de edge, de cloud- en infrastructuurwereld zien blijkbaar het laatste rekenknooppunt in de infrastructuur, vóór die bladapparaten, als de edge. Aardappel, aardappel. In ieder geval is de infrastructuurweergave van de edge waar u videocaching vindt, om de meest populaire downloads zo efficiënt en snel mogelijk te bedienen.

Achronix over platformselectie voor AI aan de rand

Rekenopties aan de edge (en in de cloud)

Colin heeft het in eerste instantie over infrastructuurvoordeel waar wat pk's nodig zijn in rekenkracht en in AI. Hij presenteert de standaardopties: CPU, GPU, ASIC of FPGA. Een CPU-gebaseerde oplossing heeft de grootste flexibiliteit omdat uw oplossing volledig op software is gebaseerd. Om dezelfde reden zal het over het algemeen ook de langzaamste, meest energieverslindende en langste latentie-optie zijn (voor heen en terug naar bladknooppunten neem ik aan). GPU's zijn iets beter qua prestaties en kracht met iets minder flexibiliteit dan CPU's. Een ASIC (aangepaste hardware) zal de snelste zijn, het laagste vermogen en de laagste latentie, hoewel in concept het minst flexibel (alle slimme dingen zitten in hardware die niet kan worden gewijzigd).

Hij presenteert FPGA (of embedded FPGA/eFPGA) als een goed compromis tussen deze uitersten. Beter op het gebied van prestaties, kracht en latentie dan CPU of GPU en ergens tussen een CPU en een GPU in op flexibiliteit. Terwijl veel beter dan een ASIC op flexibiliteit omdat een FPGA kan worden geherprogrammeerd. Wat voor mij allemaal logisch is, hoewel ik denk dat het verhaal had moeten worden voltooid door DSP's aan de platformopstelling toe te voegen. Deze kunnen AI-specifieke hardwarevoordelen hebben (vectorisatie, MAC-arrays, enz.) Die de prestaties, kracht en latentie ten goede komen. Met behoud van softwareflexibiliteit. De andere belangrijke overweging zijn de kosten. Dit is natuurlijk altijd een gevoelig onderwerp, maar AI-compatibele CPU's, GPU's en FPGA-apparaten kunnen prijzig zijn, een zorg voor de materiaallijst van een edge-node.

Het argument van Colin is voor mij het meest logisch aan de rand voor eFPGA ingebed in een grotere SoC. In een cloudtoepassing zijn de beperkingen anders. Een slimme netwerkinterfacekaart is waarschijnlijk niet zo prijsgevoelig en er kan een prestatievoordeel zijn in een op FPGA gebaseerde oplossing ten opzichte van een op software gebaseerde oplossing.

Het ondersteunen van AI-applicaties aan de compute edge via een eFPGA lijkt een optie die de moeite waard is om verder te onderzoeken. Verder weg in de richting van bladknooppunten is wazig voor mij. Een logistieke tracker of een bodemvochtsensor zal zeker geen significante rekenkracht hosten, maar hoe zit het met een spraakgestuurde tv-afstandsbediening? Of een slimme magnetron? Beiden hebben AI nodig, maar geen van beide hebben veel pk's nodig. De magnetron heeft bekabelde stroom, maar een afstandsbediening van een tv of een slimme luidspreker op afstand werkt op batterijen. Het zou interessant zijn om de eFPGA-afwegingen hier te kennen.

eFPGA-mogelijkheden voor AI

Volgens de datasheet biedt Speedster 7t volledig breukbare integer MAC's, flexibele drijvende komma, native ondersteuning voor bfloat en efficiënte matrixvermenigvuldigingen. Ik kon geen gegevens vinden over TOPS of TOPS/Watt. Ik weet zeker dat dit afhangt van de implementatie, maar voorbeelden zouden nuttig zijn. Zelfs aan de rand zijn sommige toepassingen erg prestatiegevoelig, bijvoorbeeld slimme bewaking en naar voren gerichte objectdetectie in auto's. Het zou interessant zijn om te weten waar eFPGA in dergelijke toepassingen zou kunnen passen.

Webinar die tot nadenken stemt. Je kunt het bekijken HIER.

Deel dit bericht via:

Tijdstempel:

Meer van semi-wiki