Synopsys 设计空间优化达到里程碑

Synopsys 设计空间优化达到里程碑

源节点: 1948345

我最近与 Stelios Diamantidis(杰出架构师,自主设计解决方案战略主管)谈到了 Synopsys 在 100 上的公告th 客户流片使用他们的 DSO.ai 解决方案。 我对 AI 相关文章的关注是避免围绕 AI 的一般炒作,相反,对这种炒作的怀疑促使一些人将所有 AI 声明视为万金油。 我很高兴听到 Stelios 大笑并全心全意地同意。 我们就 DSO.ai 今天可以做什么、他们的参考客户在解决方案中看到了什么(基于它今天可以做什么)以及他可以告诉我有关该技术的内容进行了非常深入的讨论。

Synopsys 设计空间优化

DSO.ai 做什么

DSO.ai 与 Fusion Compiler 和 IC Compiler II 相结合,正如 Stelios 小心强调的那样,这意味着这是一个块级优化解决方案; 完整的 SoC 还不是目标。 这符合当前的设计实践,正如 Stelios 所说的一个重要目标是轻松融入现有流程。 该技术的目的是使实施工程师(通常是单个工程师)能够提高他们的工作效率,同时探索更大的设计空间以获得比其他方式可能发现的更好的 PPA。

Synopsys 于 2021 年夏季宣布首次流片,目前已宣布 100 次流片。 这很好地说明了对此类解决方案的需求和有效性。 Stelios 补充说,对于必须多次实例化一个块的应用程序,其价值变得更加明显。 想想多核服务器、GPU 或网络交换机。 一次优化块,多次实例化——这可以显着改进 PPA。

我问这样做的客户是否都在 7nm 及以下工作。 令人惊讶的是,一直到 40nm 都有积极使用。 一个有趣的例子是闪存控制器,这是一种对性能不是很敏感但可以运行到数千万到数亿个单元的设计。 在这里,即使将尺寸缩小 5%,也会对利润率产生重大影响。

内幕是什么

DSO.ai 基于强化学习,这是最近的热门话题,但我保证不会在本文中大肆宣传。 我要求斯泰利奥斯再深入一点,但当他说他不能透露太多时,我并不感到惊讶。 他能告诉我的就足够有趣了。 他指出,在更一般的应用中,通过训练集(一个时期)的一个循环假设一种快速(几秒到几分钟)的方法来评估下一步可能的步骤,例如通过梯度比较。

但严重的块设计无法通过快速估算进行优化。 每个试验都必须贯穿整个生产流程,映射到真实的制造过程。 可能需要数小时才能运行的流程。 鉴于此约束,有效强化学习的部分策略是并行性。 剩下的就是 DSO.ai 的秘方。 当然,您可以想象,如果秘方能够根据给定的时代提出有效的改进,那么并行性将加速下一个时代的进步。

为此,此功能确实必须在云中运行以支持并行性。 私有本地云是一种选择。 微软宣布他们将在 Azure 上托管 DSO.ai,并且 ST 在 DSO.ai 新闻稿中报告说他们使用此功能来优化 Arm 核心的实施。 我想如果减少面积是值得的话,可能会围绕在公共云中跨 1000 台服务器运行优化的利弊展开一些有趣的辩论。

客户的反馈意见

Synopsys 声称客户(包括本公告中的 ST 和 SK Hynix)报告说生产力提高了 3 倍以上,总功耗降低了 25%,芯片尺寸显着减小,所有这些都减少了整体资源的使用。 鉴于 Stelios 的描述,这对我来说听起来很合理。 该工具允许在给定的时间表内探索设计状态空间中的更多点,而不是手动探索。 只要搜索算法(秘诀)有效,当然会找到比手动搜索更好的最优解。

简而言之,既不是 AI 炒作也不是万金油。 DSO.ai 建议人工智能作为现有流程的可靠工程扩展进入主流。 您可以从 新闻稿本博客.

通过以下方式分享此帖子:

时间戳记:

更多来自 半维基