Διασύνδεση κάτω από το προσκήνιο καθώς οι μετρήσεις πυρήνων επιταχύνονται

Διασύνδεση κάτω από το προσκήνιο καθώς οι μετρήσεις πυρήνων επιταχύνονται

Κόμβος πηγής: 2569830

Στην πορεία προς πιο ικανά, ταχύτερα, μικρότερα και χαμηλότερα συστήματα ισχύος, ο νόμος του Moore έδωσε στο λογισμικό μια δωρεάν διαδρομή για πάνω από 30 χρόνια περίπου, αποκλειστικά στην εξέλιξη της διαδικασίας ημιαγωγών. Το υπολογιστικό υλικό παρείχε βελτιωμένες μετρήσεις απόδοσης/περιοχής/ισχύς κάθε χρόνο, επιτρέποντας στο λογισμικό να επεκτείνεται σε πολυπλοκότητα και να προσφέρει περισσότερες δυνατότητες χωρίς μειονεκτήματα. Τότε οι εύκολες νίκες έγιναν λιγότερο εύκολες. Οι πιο προηγμένες διαδικασίες συνέχισαν να παρέχουν υψηλότερους αριθμούς πυλών ανά μονάδα επιφάνειας, αλλά τα κέρδη στην απόδοση και την ισχύ άρχισαν να ισοπεδώνονται. Δεδομένου ότι οι προσδοκίες μας για καινοτομία δεν σταμάτησαν, η πρόοδος της αρχιτεκτονικής υλικού έχει γίνει πιο σημαντική για την ανάκαμψη της χαλάρωσης.

Διασύνδεση κάτω από το επίκεντρο

Προγράμματα οδήγησης για την αύξηση του αριθμού πυρήνων

Ένα πρώιμο βήμα προς αυτή την κατεύθυνση χρησιμοποίησε CPU πολλαπλών πυρήνων για να επιταχύνει τη συνολική απόδοση μέσω νήματος ή εικονικοποίησης ενός μείγματος ταυτόχρονων εργασιών μεταξύ των πυρήνων, μειώνοντας την ισχύ όπως απαιτείται με την αδράνεια ή την απενεργοποίηση των ανενεργών πυρήνων. Ο πολυπύρηνος είναι στάνταρ σήμερα και μια τάση σε πολλούς πυρήνες (ακόμη περισσότερες CPU σε ένα τσιπ) είναι ήδη εμφανής στις επιλογές για παράδειγμα διακομιστή που διατίθενται σε πλατφόρμες cloud από AWS, Azure, Alibaba και άλλες.

Οι αρχιτεκτονικές πολλαπλών/πολλών πυρήνων είναι ένα βήμα προς τα εμπρός, αλλά ο παραλληλισμός μέσω των συστάδων CPU είναι χονδροειδής και έχει τα δικά του όρια απόδοσης και ισχύος, χάρη στο νόμο του Amdahl. Οι αρχιτεκτονικές έγιναν πιο ετερογενείς, προσθέτοντας επιταχυντές για εικόνα, ήχο και άλλες εξειδικευμένες ανάγκες. Οι επιταχυντές τεχνητής νοημοσύνης έχουν επίσης ωθήσει σε λεπτόκοκκο παραλληλισμό, μεταβαίνοντας σε συστολικές συστοιχίες και άλλες τεχνικές ειδικές για τον τομέα. Το οποίο δούλευε αρκετά καλά έως ότου εμφανίστηκε το ChatGPT με 175 δισεκατομμύρια παραμέτρους με το GPT-3 να εξελίσσεται σε GPT-4 με 100 τρισεκατομμύρια παραμέτρους – τάξεις μεγέθους πιο περίπλοκες από τα σημερινά συστήματα τεχνητής νοημοσύνης – επιβάλλοντας ακόμα πιο εξειδικευμένα χαρακτηριστικά επιτάχυνσης στους επιταχυντές AI.

Σε διαφορετικό μέτωπο, τα συστήματα πολλαπλών αισθητήρων σε εφαρμογές αυτοκινήτων ενσωματώνονται τώρα σε μεμονωμένα SoC για βελτιωμένη περιβαλλοντική ευαισθητοποίηση και βελτιωμένο PPA. Εδώ, τα νέα επίπεδα αυτονομίας στην αυτοκινητοβιομηχανία εξαρτώνται από τη σύντηξη εισόδων από πολλούς τύπους αισθητήρων σε μία μόνο συσκευή, σε υποσυστήματα που αναπαράγονται κατά 2X, 4X ή 8X.

Σύμφωνα με τον Michał Siwinski (CMO στο Arteris), η δειγματοληψία συζητήσεων ενός μήνα με πολλές ομάδες σχεδιασμού σε ένα ευρύ φάσμα εφαρμογών υποδηλώνει ότι αυτές οι ομάδες στρέφονται ενεργά σε υψηλότερους αριθμούς πυρήνων για να επιτύχουν στόχους ικανότητας, απόδοσης και ισχύος. Μου λέει ότι βλέπουν επίσης αυτή την τάση να επιταχύνεται. Οι πρόοδοι της διαδικασίας εξακολουθούν να βοηθούν με τον αριθμό των πυλών SoC, αλλά η ευθύνη για την επίτευξη των στόχων απόδοσης και ισχύος βρίσκεται πλέον σταθερά στα χέρια των αρχιτεκτόνων.

Περισσότεροι πυρήνες, περισσότερη διασύνδεση

Περισσότεροι πυρήνες σε ένα τσιπ συνεπάγονται περισσότερες συνδέσεις δεδομένων μεταξύ αυτών των πυρήνων. Μέσα σε έναν επιταχυντή μεταξύ γειτονικών στοιχείων επεξεργασίας, σε τοπική κρυφή μνήμη, σε επιταχυντές για αραιή μήτρα και άλλους εξειδικευμένους χειρισμούς. Προσθέστε ιεραρχική συνδεσιμότητα μεταξύ πλακιδίων επιταχυντή και λεωφορείων επιπέδου συστήματος. Προσθέστε συνδεσιμότητα για αποθήκευση βάρους στο τσιπ, αποσυμπίεση, μετάδοση, συλλογή και επανασυμπίεση. Προσθήκη συνδεσιμότητας HBM για προσωρινή μνήμη εργασίας. Προσθέστε έναν κινητήρα σύντηξης εάν χρειάζεται.

Το σύμπλεγμα ελέγχου που βασίζεται σε CPU πρέπει να συνδεθεί σε καθένα από αυτά τα αναπαραγόμενα υποσυστήματα και σε όλες τις συνήθεις λειτουργίες – κωδικοποιητές, διαχείριση μνήμης, νησίδα ασφαλείας και ρίζα εμπιστοσύνης, εάν χρειάζεται, UCIe εάν πρόκειται για υλοποίηση πολλαπλών chip, PCIe για I/O υψηλού εύρους ζώνης , και Ethernet ή οπτική ίνα για δικτύωση.

Πρόκειται για μεγάλη διασύνδεση, με άμεσες συνέπειες για την εμπορευσιμότητα του προϊόντος. Σε διαδικασίες κάτω των 16 nm, η υποδομή NoC συνεισφέρει πλέον 10-12% στην περιοχή. Ακόμη πιο σημαντικό, ως ο αυτοκινητόδρομος επικοινωνίας μεταξύ των πυρήνων, μπορεί να έχει σημαντικό αντίκτυπο στην απόδοση και την ισχύ. Υπάρχει πραγματικός κίνδυνος μια μη βέλτιστη υλοποίηση να σπαταλήσει την αναμενόμενη απόδοση της αρχιτεκτονικής και τα κέρδη ισχύος, ή ακόμα χειρότερα, να οδηγήσει σε σύγκλιση πολλών βρόχων επανασχεδιασμού. Ωστόσο, η εύρεση μιας καλής υλοποίησης σε μια περίπλοκη κάτοψη SoC εξακολουθεί να εξαρτάται από αργές βελτιστοποιήσεις δοκιμής και σφάλματος σε ήδη στενά χρονοδιαγράμματα σχεδιασμού. Πρέπει να κάνουμε το άλμα στη σχεδίαση NoC με φυσική γνώση, για να εγγυηθούμε πλήρη απόδοση και υποστήριξη ισχύος από πολύπλοκες ιεραρχίες NoC και πρέπει να κάνουμε αυτές τις βελτιστοποιήσεις πιο γρήγορες.

Τα σχέδια NoC με φυσική επίγνωση διατηρούν τον νόμο του Moore σε καλό δρόμο

Ο νόμος του Moore μπορεί να μην είναι νεκρός, αλλά η πρόοδος στην απόδοση και την ισχύ σήμερα προέρχεται από την αρχιτεκτονική και τη διασύνδεση NoC και όχι από τη διαδικασία. Η αρχιτεκτονική ωθεί περισσότερους πυρήνες επιταχυντών, περισσότερους επιταχυντές μέσα σε επιταχυντές και περισσότερη αναπαραγωγή υποσυστήματος στο τσιπ. Όλα αυξάνουν την πολυπλοκότητα της διασύνδεσης στο chip. Καθώς τα σχέδια αυξάνουν τον αριθμό πυρήνων και μετακινούνται σε γεωμετρίες επεξεργασίας στα 16 nm και κάτω, οι πολυάριθμες διασυνδέσεις NoC που καλύπτουν το SoC και τα υποσυστήματα του μπορούν να υποστηρίξουν το πλήρες δυναμικό αυτών των πολύπλοκων σχεδίων μόνο εάν εφαρμοστούν βέλτιστα έναντι φυσικών και χρονικών περιορισμών – μέσω δικτύου με φυσική γνώση στο σχέδιο τσιπ.

Εάν ανησυχείτε επίσης για αυτές τις τάσεις, ίσως θέλετε να μάθετε περισσότερα για την τεχνολογία IP του Arteris FlexNoC 5 ΕΔΏ.

Μοιραστείτε αυτήν την ανάρτηση μέσω:

Σφραγίδα ώρας:

Περισσότερα από Semiwiki