Serverdesign mit Pin-effizienter CXL-Schnittstelle (Georgia Tech)

Serverdesign mit Pin-effizienter CXL-Schnittstelle (Georgia Tech)

Quellknoten: 2642551

Ein neues technisches Papier mit dem Titel „A Case for CXL-Centric Server Processors“ wurde von Forschern der Georgia Tech verfasst.

Abstract:
„Das Speichersystem ist ein wichtiger Leistungsfaktor für Serverprozessoren. Ständig wachsende Kernzahlen und Datensätze erfordern eine höhere Bandbreite und Kapazität sowie eine geringere Latenz vom Speichersystem. Um mit den wachsenden Anforderungen Schritt zu halten, bietet DDR – die dominierende Prozessorschnittstelle zum Speicher in den letzten zwei Jahrzehnten – mit jeder Generation eine höhere Bandbreite. Da jedoch jede parallele DDR-Schnittstelle eine große Anzahl von On-Chip-Pins erfordert, wird die Speicherbandbreite des Prozessors letztendlich durch die Anzahl der Pins begrenzt, die eine knappe Ressource darstellen. Bei begrenzter Bandbreite konkurrieren in der Regel mehrere Speicheranforderungen um jeden Speicherkanal, was zu erheblichen Warteschlangenverzögerungen führt, die häufig die DRAM-Dienstzeit in Anspruch nehmen und die Leistung beeinträchtigen.

Wir präsentieren CoaXiaL, ein Serverdesign, das Einschränkungen der Speicherbandbreite überwindet, indem es alle DDR-Schnittstellen zum Prozessor durch die Pin-effizientere CXL-Schnittstelle ersetzt. Die weit verbreitete Akzeptanz und die industrielle Dynamik von CXL machen einen solchen Übergang möglich und bieten eine viermal höhere Bandbreite pro Pin im Vergleich zu DDR bei einem moderaten Latenz-Overhead. Wir zeigen, dass die Latenzprämie von CXL bei einem breiten Spektrum an Arbeitslasten durch die höhere Bandbreite mehr als ausgeglichen wird. Da CoaXiaL Speicheranforderungen auf mehr Kanäle verteilt, werden die Warteschlangenverzögerungen und damit sowohl der Durchschnittswert als auch die Varianz der Speicherzugriffslatenz drastisch reduziert. Unsere Auswertung mit einer Vielzahl von Workloads zeigt, dass CoaXiaL die Leistung von durchsatzorientierten Manycore-Servern im Durchschnitt um das 4-fache und um bis zu 1.52-fache verbessert.“

Finden Sie die technisches Papier hier. Kann 2023.

Autoren: Albert Cho, Anish Saxena, Moinuddin Qureshi, Alexandros Daglis. arXiv:2305.05033v1.
https://doi.org/10.48550/arXiv.2305.05033

Zeitstempel:

Mehr von Semi-Engineering