ML 추론 가속화를 위한 CiM 통합

플라톤에 의해 재발행

팔로워 : 0

퍼듀대학교 연구진이 “WWW: What, When, Where to Compute-in-Memory”라는 기술 논문을 발표했습니다.

요약 :

“CiM(Compute-in-Memory)은 von Neumann 시스템의 높은 데이터 이동 비용을 완화하는 강력한 솔루션으로 부상했습니다. CiM은 기계 학습(ML) 추론의 주요 계산인 메모리에서 대규모 병렬 일반 행렬 곱셈(GEMM) 작업을 수행할 수 있습니다. 그러나 컴퓨팅을 위한 메모리 용도 변경은 1) 사용할 CiM 유형: 다수의 아날로그 및 디지털 CiM이 주어지면 시스템 관점에서 적합성을 결정해야 한다는 주요 질문을 제기합니다. 2) CiM을 사용하는 경우: ML 추론에는 다양한 메모리 및 컴퓨팅 요구 사항이 있는 워크로드가 포함되므로 CiM이 표준 처리 코어보다 더 유용한 시기를 식별하기 어렵습니다. 3) CiM 통합 위치: 각 메모리 수준에는 대역폭과 용량이 다르며 이는 CiM 통합의 데이터 이동 및 지역성 이점에 영향을 미칩니다.
이 문서에서는 ML 추론 가속화를 위한 CiM 통합과 관련된 이러한 질문에 대한 답변을 살펴봅니다. 우리는 아날로그 및 디지털 프리미티브를 모두 포함하는 CiM 프로토타입의 초기 시스템 수준 평가에 Timeloop-Accelergy를 사용합니다. 우리는 CiM을 Nvidia A100과 유사한 기본 아키텍처의 다양한 캐시 메모리 수준에 통합하고 다양한 ML 워크로드에 맞게 데이터 흐름을 조정합니다. 우리의 실험에서는 CiM 아키텍처가 에너지 효율성을 향상시켜 INT-0.12 정밀도로 설정된 기준보다 최대 8배 더 낮은 에너지를 달성하고 가중치 인터리빙 및 복제를 통해 최대 4배의 성능 향상을 달성하는 것으로 나타났습니다. 제안된 작업은 사용할 CiM 유형과 GEMM 가속화를 위해 캐시 계층 구조에서 CiM을 언제, 어디서 최적으로 통합할지에 대한 통찰력을 제공합니다.”

찾기 여기에 기술 문서가 있습니다. 2023년 XNUMX월 출판(사전 인쇄).

샤르마, 탄비, 무스타파 알리, 인드라닐 차크라보르티, 카우식 로이. “WWW: 무엇을, 언제, 어디서 메모리 내 컴퓨팅을 수행할 것인가.” arXiv 사전 인쇄 arXiv:2312.15896(2023).

관련 독서
메모리 내 컴퓨팅을 통해 AI 에너지 효율성 향상
제타스케일 워크로드를 처리하고 고정 전력 예산 내에서 유지하는 방법
생물학적 효율성을 갖춘 메모리 내 컴퓨팅 모델링
Generative AI는 칩 제조업체가 컴퓨팅 리소스를 보다 지능적으로 사용하도록 합니다.
AI의 SRAM: 메모리의 미래
SRAM이 새로운 컴퓨팅 아키텍처와 기존 컴퓨팅 아키텍처에서 중요한 요소로 간주되는 이유.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://semiengineering.com/cim-integration-for-ml-inference-acceleration/

타임 스탬프 : 2024 년 1 월 16 일

타임 스탬프 : 6년 2023월 XNUMX일

ML 추론 가속화를 위한 CiM 통합

플라톤에 의해 재발행

요약 :

더보기 세미 엔지니어링

설계 및 검증 방법론의 세분화

디자인 IP

RTL 구조 조정 문제

측면 게이트형 강유전성 전계 효과 트랜지스터로 구성된 적층형 강유전성 메모리 어레이

ORNL의 Frontier 슈퍼컴퓨터에서 수십억에서 수조 개의 매개변수를 사용하여 대규모 LLM 모델 교육

Fabs는 머신 러닝을 강화하기 시작합니다.

연구 비트: 3월 XNUMX일

RISC-V와 HW 가속기를 통합한 Edge HW-SW 공동 설계 플랫폼

CXL 기반 메모리 장치 내에서 유연한 주소 매핑 및 데이터 마이그레이션을 위한 DRAM 변환 계층, 메커니즘

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정