Meta 将与 AMD、Nvidia GPU 一起部署定制 AI 芯片

由柏拉图重新发布

关注： 0

经过多年的发展，Meta 可能最终会在今年以有意义的方式推出其自主研发的人工智能加速器。

Facebook 帝国本周确认了其元训练推理加速器 (MTIA) 系列芯片的愿望，以补充 Nvidia H100 和 AMD MI300X GPU 的部署。具体来说，Meta 将部署推理优化处理器，据报道代号为阿耳忒弥斯，基于硅谷巨头的第一代零件戏弄去年。

Meta 发言人表示：“我们对 MTIA 的内部芯片工作取得的进展感到非常兴奋，并有望在 2024 年开始在生产中部署我们的推理变体。” 注册上周四。

“我们认为我们内部开发的加速器与商用 GPU 具有高度互补性，可以在元特定工作负载上提供性能和效率的最佳组合，”该代表继续说道。细节？没有。该发言人告诉我们：“我们期待在今年晚些时候分享有关我们未来 MTIA 计划的更多最新信息。”

我们认为这意味着第二代专注于推理的芯片正在广泛推出，继第一代仅用于推理的实验室版本之后，我们可能会在稍后发现主要用于训练或训练和推理的部分。

随着人工智能工作负载部署的增长，Meta 已成为 Nvidia 和 AMD 的最佳客户之一，增加了对专用芯片的需求和使用，以使其机器学习软件尽可能快地运行。因此，Instagram 巨头决定开发自己的定制处理器并不令人意外。

事实上，从表面上看，大型企业在实际部署方面比定制人工智能芯片方相对较晚。多年来，亚马逊和谷歌一直在使用自主开发的组件来加速内部机器学习系统，例如推荐模型和客户机器学习代码。与此同时，微软去年推出了其自主研发的加速器。

但除了 Meta 大规模推出 MTIA 推理芯片这一事实之外，该社交网络还没有透露其精确的架构，也没有透露为内部芯片保留哪些工作负载以及将哪些工作负载转移到 AMD 和 Nvidia 的 GPU。

Meta 很可能会在其定制 ASIC 上运行已建立的模型，以释放 GPU 资源以用于更动态或不断发展的应用程序。我们之前已经看到 Meta 走上了这条路线，使用了旨在卸载数据和计算密集型视频工作负载的定制加速器。

至于底层设计，SemiAnalysis 的行业观察人士告诉我们，新芯片紧密基于 Meta 第一代部件的架构。

垫脚石

经过三年的开发，Meta 的 MTIA v2023 部件于 1 年初发布，我们的朋友们在 下一个平台 看着去年春天，我们专门针对深度学习推荐模型进行了设计。

第一代芯片围绕 RISC-V CPU 集群构建，并使用台积电的 7 纳米工艺制造。在引擎盖下，该组件采用了一个 128×128 的处理元件矩阵，每个处理元件都配备了两个 RV CPU 核心，其中一个配备了矢量数学扩展。这些内核由大量 5MB 片上 SRAM 和高达 XNUMXGB LPDDRXNUMX 内存供电。

正如 Meta 去年声称的那样，该芯片的运行频率为 800 MHz，INT102.4 性能每秒可实现 8 万亿次运算，或半精度 (FP51.2) 下的 16 teraFLOPS。相比之下，Nvidia 的 H100 能够实现近 8 petaFLOPS 的稀疏 FP25 性能。虽然远不如 Nvidia 或 AMD 的 GPU 强大，但该芯片确实有一个主要优势：功耗。该芯片本身的热设计功率仅为 XNUMX 瓦。

根据半分析Meta 的最新芯片拥有改进的内核，并将 LPDDR5 替换为使用台积电晶圆基板上芯片 (CoWoS) 技术封装的高带宽内存。

另一个显着的区别是 Meta 的第二代芯片实际上将在其数据中心基础设施中广泛部署。据 Facebook 巨头称，虽然第一代部件用于运行生产广告模型，但它从未离开过实验室。