Το Acronix στην επιλογή πλατφόρμας για AI στο Edge

Το Acronix στην επιλογή πλατφόρμας για AI στο Edge

Κόμβος πηγής: 1931159

Ο Colin Alexander (Διευθυντής μάρκετινγκ προϊόντων στην Achronix) δημοσίευσε πρόσφατα ένα διαδικτυακό σεμινάριο σχετικά με αυτό το θέμα. Σε μόλις 20 λεπτά το διαδικτυακό σεμινάριο είναι ένα εύκολο ρολόι και μια χρήσιμη ενημέρωση σχετικά με την κυκλοφορία δεδομένων και τις επιλογές υλοποίησης. Οι λήψεις εξακολουθούν να κυριαρχούνται από βίντεο (πάνω από 50% για το Facebook), το οποίο εξαρτάται πλέον σε μεγάλο βαθμό από την προσωρινή αποθήκευση στο άκρο ή κοντά. Ποιο από αυτά ισχύει εξαρτάται από τον ορισμό σας για το "άκρο". Ο κόσμος του IoT βλέπει τον εαυτό του ως την άκρη, το cloud και ο κόσμος της υποδομής προφανώς βλέπουν τον τελευταίο υπολογιστικό κόμβο στην υποδομή, πριν από αυτές τις συσκευές φύλλου, ως την άκρη. Πατάτα, πατατό. Σε κάθε περίπτωση, η προβολή υποδομής του άκρου είναι το σημείο όπου θα βρείτε προσωρινή αποθήκευση βίντεο, για να εξυπηρετείτε τις πιο δημοφιλείς λήψεις όσο το δυνατόν πιο αποτελεσματικά και όσο το δυνατόν πιο γρήγορα.

Το Acronix στην επιλογή πλατφόρμας για AI στο Edge

Υπολογίστε τις επιλογές στην άκρη (και στο σύννεφο)

Ο Colin μιλά αρχικά για το πλεονέκτημα της υποδομής όπου απαιτείται κάποια ιπποδύναμη στον υπολογιστή και στην τεχνητή νοημοσύνη. Παρουσιάζει τις τυπικές επιλογές: CPU, GPU, ASIC ή FPGA. Μια λύση που βασίζεται σε CPU έχει τη μεγαλύτερη ευελιξία, επειδή η λύση σας θα βασίζεται εξ ολοκλήρου στο λογισμικό. Για τον ίδιο λόγο, θα είναι επίσης γενικά η πιο αργή, πιο απαιτητική και μεγαλύτερη λανθάνουσα επιλογή (υποθέτω ότι για το ταξίδι μετ' επιστροφής σε κόμβους φύλλων). Οι GPU είναι κάπως καλύτερες σε απόδοση και ισχύ με λίγο λιγότερη ευελιξία από τις CPU. Ένα ASIC (προσαρμοσμένο υλικό) θα είναι ο ταχύτερος, η χαμηλότερη ισχύς και η χαμηλότερη καθυστέρηση, αν και στην ιδέα είναι λιγότερο ευέλικτο (όλα τα έξυπνα είναι σε υλικό που δεν μπορεί να αλλάξει).

Παρουσιάζει το FPGA (ή το ενσωματωμένο FPGA/eFPGA) ως έναν καλό συμβιβασμό μεταξύ αυτών των άκρων. Καλύτερη απόδοση, ισχύ και λανθάνουσα κατάσταση από CPU ή GPU και κάπου μεταξύ CPU και GPU για ευελιξία. Ενώ είναι πολύ καλύτερο από ένα ASIC σχετικά με την ευελιξία, επειδή ένα FPGA μπορεί να επαναπρογραμματιστεί. Κάτι που είναι λογικό για μένα όσο πάει, αν και πιστεύω ότι η ιστορία θα έπρεπε να είχε ολοκληρωθεί με την προσθήκη DSP στη σειρά πλατφόρμας. Αυτά μπορεί να έχουν πλεονεκτήματα υλικού ειδικά για το AI (διανυσματοποίηση, συστοιχίες MAC, κ.λπ.) που ωφελούν την απόδοση, την ισχύ και την καθυστέρηση. Διατηρώντας παράλληλα την ευελιξία του λογισμικού. Το άλλο σημαντικό στοιχείο είναι το κόστος. Αυτό είναι πάντα ένα ευαίσθητο θέμα φυσικά, αλλά οι CPU, οι GPU και οι συσκευές FPGA με ικανότητα AI μπορεί να είναι ακριβές, κάτι που προκαλεί ανησυχία για τον λογαριασμό των υλικών ενός κόμβου άκρης.

Το επιχείρημα του Colin είναι πιο λογικό για μένα στην άκρη για το eFPGA που είναι ενσωματωμένο σε ένα μεγαλύτερο SoC. Σε μια εφαρμογή cloud, οι περιορισμοί είναι διαφορετικοί. Μια έξυπνη κάρτα διασύνδεσης δικτύου μάλλον δεν είναι τόσο ευαίσθητη στην τιμή και μπορεί να υπάρχει πλεονέκτημα απόδοσης σε μια λύση που βασίζεται σε FPGA έναντι μιας λύσης που βασίζεται σε λογισμικό.

Η υποστήριξη εφαρμογών AI στο υπολογιστικό άκρο μέσω ενός eFPGA μοιάζει με μια επιλογή που αξίζει να διερευνηθεί περαιτέρω. Πιο έξω προς τους κόμβους φύλλων είναι ασαφές για μένα. Ένας ιχνηλάτης logistics ή ένας αισθητήρας υγρασίας εδάφους σίγουρα δεν θα φιλοξενήσει σημαντικό υπολογισμό, αλλά τι γίνεται με ένα τηλεχειριστήριο τηλεόρασης που ενεργοποιείται με φωνή; Ή έξυπνος φούρνος μικροκυμάτων; Και τα δύο χρειάζονται τεχνητή νοημοσύνη, αλλά κανένα δεν χρειάζεται πολλή ιπποδύναμη. Ο φούρνος μικροκυμάτων διαθέτει ενσύρματη τροφοδοσία, αλλά ένα τηλεχειριστήριο τηλεόρασης ή τηλεχειριστήριο έξυπνο ηχείο λειτουργεί με μπαταρίες. Θα ήταν ενδιαφέρον να γνωρίζουμε τις ανταλλαγές eFPGA εδώ.

Δυνατότητες eFPGA για AI

Σύμφωνα με το φύλλο δεδομένων, το Speedster 7t προσφέρει πλήρως θραύσιμα ακέραια MAC, ευέλικτο κινητή υποδιαστολή, εγγενή υποστήριξη για bfloat και αποτελεσματικούς πολλαπλασιασμούς πινάκων. Δεν μπόρεσα να βρω δεδομένα για TOPS ή TOPS/Watt. Είμαι βέβαιος ότι εξαρτάται από την εφαρμογή, αλλά παραδείγματα θα ήταν χρήσιμα. Ακόμη και στην άκρη, ορισμένες εφαρμογές είναι πολύ ευαίσθητες στις επιδόσεις - για παράδειγμα, η έξυπνη επιτήρηση και η ανίχνευση αντικειμένων με όψη προς τα εμπρός στα αυτοκίνητα. Θα ήταν ενδιαφέρον να γνωρίζουμε πού μπορεί να χωρέσει το eFPGA σε τέτοιες εφαρμογές.

Διαδικτυακό σεμινάριο που προκαλεί σκέψεις. Μπορείτε να το παρακολουθήσετε ΕΔΏ.

Μοιραστείτε αυτήν την ανάρτηση μέσω:

Σφραγίδα ώρας:

Περισσότερα από Semiwiki