CPU에 대한 유연한 구조적 희소성을 지원하기 위한 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장(Georgia Tech, Intel Labs)

CPU에 대한 유연한 구조적 희소성을 지원하기 위한 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장(Georgia Tech, Intel Labs)

소스 노드 : 1977909

"VEGETA: Vertically-Integrated Extensions for Sparse/Dense GEMM Tile Acceleration on CPUs"라는 제목의 기술 문서가 Georgia Tech와 Intel Labs의 연구원들에 의해 출판(사전 인쇄)되었습니다.

요약 :

“CPU의 딥 러닝(DL) 가속 지원은 최근 여러 회사(Arm, Intel, IBM)가 GEMM 명령을 통해 액세스할 수 있는 특수 매트릭스 엔진이 있는 제품을 발표하면서 많은 주목을 받았습니다. CPU는 널리 퍼져 있으며 에지/HPC/클라우드 플랫폼에서 실행되는 DL 워크로드 전반에서 다양한 요구 사항을 처리해야 합니다. 따라서 DL 워크로드는 모델의 계산 및 메모리 크기를 줄이기 위해 희소성을 수용하므로 밀도 매트릭스 엔진의 활용도가 낮고 캐시 및 레지스터의 비효율적인 사용을 방지하기 위해 CPU가 희소성에 대한 지원을 추가하는 것도 필수적입니다. 이 작업은 다양한 수준의 희소성을 가진 다양한 DL 모델에 대한 프로그래밍 가능한 지원을 가능하게 하는 CPU에 대한 유연한 구조적 희소성을 지원하기 위해 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장 세트인 VEGETA를 제공합니다. CPU의 최첨단(SOTA) 고밀도 매트릭스 엔진과 비교할 때 VEGETA 엔진은 1.09:2.20(고밀도), 3.74:3.28를 실행할 때 4x, 4x, 2x 및 4x 속도 향상을 제공합니다. , 1:4 및 구조화되지 않은(95%) 희소 DNN 레이어.”

찾기 여기에 기술 문서. 사전 인쇄는 2023년 XNUMX월에 게시되었습니다.

정건화 외 "VEGETA: CPU에서 희소/고밀도 GEMM 타일 가속을 위한 수직 통합 확장." arXiv 프리프린트 arXiv:2302.08687 (2023).

타임 스탬프 :

더보기 세미 엔지니어링