Data-Centric Reconfigurable Array Chiplets (Princeton)

Republicado por Platão

seguidores: 0

A technical paper titled “Massive Data-Centric Parallelism in the Chiplet Era” was published by researchers at Princeton University.

Abstrato:

“Traditionally, massively parallel applications are executed on distributed systems, where computing nodes are distant enough that the parallelization schemes must minimize communication and synchronization to achieve scalability. Mapping communication-intensive workloads to distributed systems requires complicated problem partitioning and dataset pre-processing. With the current AI-driven trend of having thousands of interconnected processors per chip, there is an opportunity to re-think these communication-bottlenecked workloads. This bottleneck often arises from data structure traversals, which cause irregular memory accesses and poor cache locality.
Recent works have introduced task-based parallelization schemes to accelerate graph traversal and other sparse workloads. Data structure traversals are split into tasks and pipelined across processing units (PUs). Dalorex demonstrated the highest scalability (up to thousands of PUs on a single chip) by having the entire dataset on-chip, scattered across PUs, and executing the tasks at the PU where the data is local. However, it also raised questions on how to scale to larger datasets when all the memory is on chip, and at what cost.

To address these challenges, we propose a scalable architecture composed of a grid of Data-Centric Reconfigurable Array (DCRA) chiplets. Package-time reconfiguration enables creating chip products that optimize for different target metrics, such as time-to-solution, energy, or cost, while software reconfigurations avoid network saturation when scaling to millions of PUs across many chip packages. We evaluate six applications and four datasets, with several configurations and memory technologies, to provide a detailed analysis of the performance, power, and cost of data-local execution at scale. Our parallelization of Breadth-First-Search with RMAT-26 across a million PUs reaches 3323 GTEPS.”

Encontre o técnico papel aqui. Publicado em abril de 2023 (pré-impressão).

Orenes-Vera, Marcelo, Esin Tureci, David Wentzlaf, and Margaret Martonosi. “Massive Data-Centric Parallelism in the Chiplet Era.” pré-impressão do arXiv arXiv: 2304.09389 (2023).

Relacionado
Mini-consórcios se formando em torno de chips
Os mercados comerciais de chips ainda estão num horizonte distante, mas as empresas estão começando cedo com parcerias mais limitadas.
Riscos de segurança de chips subestimados
A magnitude dos desafios de segurança dos chips comerciais é assustadora.
A corrida em direção aos chips de fundição mista
Os desafios de montar chips de diferentes fundições estão apenas começando a surgir.
Design Considerations And Recent Advancements In Chiplets (UC Berkeley/ Peking University)

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. Acesse aqui.
Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
Fonte: https://semiengineering.com/data-centric-reconfigurable-array-dcra-chiplets-princeton/

Carimbo de hora: 21 de abril de 2023

Carimbo de hora: Junho 6, 2023

Chiplets de array reconfiguráveis centrados em dados (Princeton)

Republicado por Platão

Mais de Semi Engenharia

Os desafios dos testes aumentam à medida que aumentam as demandas por confiabilidade

Pedaços de pesquisa: 14 de fevereiro

Medição da topografia 3D da parede lateral e LER para padrões fotorresistentes usando a tecnologia AFM de ponta inclinada

DeepGBASS: segmentação semântica profunda guiada com reconhecimento de limites

Processadores de particionamento para cargas de trabalho de IA

E/S programável de uso geral

Chiplets: são necessários mais padrões

Análise multivariada para visibilidade total do processo

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta