CPU에 대한 유연한 구조적 희소성을 지원하기 위한 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장(Georgia Tech, Intel Labs)

세미 엔지니어링

CPU에 대한 유연한 구조적 희소성을 지원하기 위한 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장(Georgia Tech, Intel Labs)

반도체타임 스탬프 : 24 년 2023 월 6 일 오후 10:XNUMX

소스 노드 : 1977909

플라톤에 의해 재발행

팔로워 : 0

"VEGETA: Vertically-Integrated Extensions for Sparse/Dense GEMM Tile Acceleration on CPUs"라는 제목의 기술 문서가 Georgia Tech와 Intel Labs의 연구원들에 의해 출판(사전 인쇄)되었습니다.

요약 :

“CPU의 딥 러닝(DL) 가속 지원은 최근 여러 회사(Arm, Intel, IBM)가 GEMM 명령을 통해 액세스할 수 있는 특수 매트릭스 엔진이 있는 제품을 발표하면서 많은 주목을 받았습니다. CPU는 널리 퍼져 있으며 에지/HPC/클라우드 플랫폼에서 실행되는 DL 워크로드 전반에서 다양한 요구 사항을 처리해야 합니다. 따라서 DL 워크로드는 모델의 계산 및 메모리 크기를 줄이기 위해 희소성을 수용하므로 밀도 매트릭스 엔진의 활용도가 낮고 캐시 및 레지스터의 비효율적인 사용을 방지하기 위해 CPU가 희소성에 대한 지원을 추가하는 것도 필수적입니다. 이 작업은 다양한 수준의 희소성을 가진 다양한 DL 모델에 대한 프로그래밍 가능한 지원을 가능하게 하는 CPU에 대한 유연한 구조적 희소성을 지원하기 위해 고밀도 매트릭스 엔진에 대한 ISA 및 마이크로아키텍처 확장 세트인 VEGETA를 제공합니다. CPU의 최첨단(SOTA) 고밀도 매트릭스 엔진과 비교할 때 VEGETA 엔진은 1.09:2.20(고밀도), 3.74:3.28를 실행할 때 4x, 4x, 2x 및 4x 속도 향상을 제공합니다. , 1:4 및 구조화되지 않은(95%) 희소 DNN 레이어.”

찾기 여기에 기술 문서. 사전 인쇄는 2023년 XNUMX월에 게시되었습니다.

정건화 외 "VEGETA: CPU에서 희소/고밀도 GEMM 타일 가속을 위한 수직 통합 확장." arXiv 프리프린트 arXiv:2302.08687 (2023).

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
플라토 블록체인. Web3 메타버스 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
출처: https://semiengineering.com/isa-and-microarchitecture-extensions-over-dense-matrix-engines-to-support-flexible-structured-sparsity-for-cpus-georgia-tech-intel-labs/

타임 스탬프 : 2023년 ２월 24일

더보기 세미 엔지니어링

AI 워크로드에 대한 프로세서 트레이드오프

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2815087

타임 스탬프 : 10년 2023월 XNUMX일

키사이트, Cliosoft 인수

소스 클러스터 :

세미 엔지니어링

소스 노드 : 1974310

타임 스탬프 : 23년 2023월 XNUMX일

멀티 다이 통합

소스 클러스터 :

세미 엔지니어링

소스 노드 : 1868028

타임 스탬프 : 4년 2023월 XNUMX일

Synopsys 타이밍 제약 관리자: 제약 검증

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2875341

타임 스탬프 : 11년 2023월 XNUMX일

연구 비트: 17월 XNUMX일

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2942097

타임 스탬프 : 17년 2023월 XNUMX일

업계 유명 인사들이 비-EUV 첨단 기술을 발전시킬 수 있는 기회를 강조합니다

업계 유명 인사들이 비-EUV 첨단 기술을 발전시킬 수 있는 기회를 강조합니다

소스 클러스터 :

세미 엔지니어링

소스 노드 : 3026078

타임 스탬프 : 12월 19, 2023

하이퍼스케일 HW 최적화된 신경 아키텍처 검색(Google)

하이퍼스케일 HW 최적화된 신경 아키텍처 검색(Google)

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2600411

타임 스탬프 : 21년 2023월 XNUMX일

ISO 26262를 위한 지능형 추적성

ISO 26262를 위한 지능형 추적성

소스 클러스터 :

세미 엔지니어링

소스 노드 : 1934259

타임 스탬프 : 1년 2023월 XNUMX일

회로 레이아웃 수준의 하드웨어 트로이 목마 탐지

회로 레이아웃 수준의 하드웨어 트로이 목마 탐지

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2640121

타임 스탬프 : 2023 년 5 월 9 일

SEMI-PointRend를 사용한 SEM 이미지의 반도체 결함에 대한 보다 정확하고 상세한 분석

SEMI-PointRend를 사용한 SEM 이미지의 반도체 결함에 대한 보다 정확하고 상세한 분석

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2006201

타임 스탬프 : 월 10, 2023

성능 평가를 통한 다중 AI 가속기 및 GPU의 LLM 연구

성능 평가를 통한 다중 AI 가속기 및 GPU의 LLM 연구

소스 클러스터 :

세미 엔지니어링

소스 노드 : 2945288

타임 스탬프 : 19년 2023월 XNUMX일

DL 에지 추론을 위한 도구 및 기법 검토

DL 에지 추론을 위한 도구 및 기법 검토

소스 클러스터 :

세미 엔지니어링

소스 노드 : 1961240

타임 스탬프 : 16년 2023월 XNUMX일