本地设计和云设计之间的权衡

本地设计和云设计之间的权衡

源节点: 2825730

会议专家:半导体工程与 Philip Steinke(来自 CAD 基础设施和物理设计的研究员)坐下来讨论公司如何以及为何在本地和云中划分工作,以及需要注意的事项。 AMD公司; Mahesh Turaga,云业务开发副总裁 Cadence设计系统公司; Richard Ho,Lightmatter 硬件工程副总裁; Craig Johnson,云解决方案副总裁 西门子数字工业软件; 和 Rob Aitken,研究员 新思。 以下是设计自动化会议上在现场观众面前进行的对话的摘录。 本次讨论的第一部分是 相关信息.

SE:当今芯片设计面临如此多的风险,如何利用云资源实现最佳投资回报率?

斯坦克: 在选择云支持的工作流程时,我们首先查看数据。 哪些拥有一组可管理的数据,可以封装这些数据,转移到云托管数据中心进行某种计算,然后返回合理数量的结果? 我们关注的领域之一是前端验证。 我首选的流程包括将我们的构建保留在本地,将模型本身与测试刺激捆绑在一起,然后将其发送出去以在云计算上执行实际的模拟活动。 我们完成云支持的另一类工作负载是全芯片验证工作负载、用于静态时序、物理验证和功耗的全芯片签核运行 - 主要是因为在布局布线类型环境中,您会进入日常 ECO 或定期 ECO 的定期节奏正在发生并进行更改,并且已经有了数据管理设置,并且已完成设计的发布。 因此,我们能够将挂钩放入该发布机制中,不仅仅是将其放入我们自己的数据中心的某种本地发布卷中,而是将该数据推送到已选择用于执行这些数据的云数据中心工作。 对于如此大的工作负载的担忧之一是,如果您已经合并了 Oasis,或者您已经收集了想要运行静态时序的设计的所有规格,那么需要转移的数据量很大一次全部。 但通过更新块级发布方法,它们会随着一天中每个块的发布而逐渐渗透进来。 这样您就可以以较低的延迟启动云托管的全芯片分析工作。 我看到的主要挑战是访问具有足够内存来运行这些大型作业的良好云虚拟机。 这是我们继续推动云合作伙伴提供的另一个领域——提供充足 RAM 的解决方案,供芯片设计公司使用。

SE:对于辨别工作负载何时应该在本地完成还是在云上完成,您有什么建议?

艾特肯: 我们在这个小组的代表中看到了一个有趣的动态,因为理查德可能采取的方式和菲尔可能采取的方式会有所不同。 一种非常注重在需求方面跨越高峰和低谷的设计。 据推测,AMD 一直在进行大量的设计,因此他们在尝试做的事情方面做了初步的努力。 如果您想要在云上完成所有设计,并且根本不想拥有本地数据中心,那么什么基础设施才有意义? 您的处理方式将不同于您使用云作为现有大型基础设施的备份和扩展功能。

SE:实际上,您是如何决定的?

咳嗽: 你看看数据。 您有多少数据? 您将生成多少数据? 你需要什么回来? 使其成功的关键是您想要从云端返回的信息。 本地部署必须最小化,因此只会显示报告和回归结果。 我们的构建实际上是在我们的小型本地部署上进行的。 我们将其交付并运行模拟,然后进行自己的覆盖率分析。 然后我们将结果发回,结果非常小,而且很好。 后端不一样。 在物理设计部分,您将设计发送到那里,您希望它尽可能长时间地保留在云端,因为这些数据库非常庞大,而且您真的根本不希望它返回。 那时,它就是基础设施即服务。 您只需让您的人员登录云并在那里完成所有物理设计,直到获得 GDS。 在那里,它是机器内部的东西——你可以获得多少内存? 这是限制因素之一。 在云中拥有非常大的虚拟机实际上非常昂贵。 很多时候,自己购买会更便宜。 我们还没有讨论成本。 云的成本并不是人们想象的那样。 这是相当高的。 通常情况下,它比本地部署的情况要多,因此您必须平衡这一点,才能获得灵活性和访问大内存资源的优势。 对于每个客户来说,外观都将是非常个性化的。

约翰逊: 这个问题确实与这样做的投资回报率有关。 这取决于您作为环境的用户想要实现的目标,这也是挑战的一部分。 每家公司都会根据自己的战略进行自己的计算,以弄清楚他们想在云中做什么,以及他们愿意花多少钱来获得这种好处。 另一个因素是您衡量的回报与拥有成本不同。 我们往往更擅长进行总体拥有成本分析,而不是投资回报率的“R”部分,后者必须发挥更多无形因素,即吞吐量时间和上市时间优势。

艾特肯: 即使是像延迟这样简单的事情,当您运行一个工具并且响应时间是“我移动了鼠标,然后过了一会儿发生了一些事情”时,这可能会非常令人沮丧。

图拉加: 从历史上看,如果我们看看云的投资回报率,就会发现有三类工具可以非常有效地利用云。 首先是设计组织、设计迭代、回归和验证。 其次是长时间运行的模拟具有繁重的计算负载,并且它们可以很好地扩展以在各种实例中利用计算算法。 第三是交互类型,比如需要延迟并且还需要大量协作增长的工具。 这些是从云中获得最佳投资回报率的三类工具。 同样,根据每个客户的情况,这取决于他们想要在云中启动哪种工具。 我们有些客户是从验证开始的,但这取决于你的具体客户情况。

SE:对于云用户来说,您是如何做出云使用模型决策的?

斯坦克: 我们已经相处了一段时间了。 我们已经有了一个相当大的数据中心,所以我们不需要一开始就全力以赴。 我们希望通过云所提供的功能来增强我们所拥有的功能。 我们的本地数据中心继续提供大量的计算能力。 项目来来去去,意想不到的事情发生; 能够分层这种灵活性并拥有多个可供我们使用的计算源是我们想要利用的优势。 这是我们选择云的一个重要动机,也是我们这样做的原因。 我们已经有了前期投资,所以我们希望扩大和发展它。

咳嗽: 我可以从两个角度来回答这个问题。 第一个观点是,在我加入 Lightmatter 之前,我在 Google 从事 TPU 和基础设施团队的工作,我们在那里也使用了云。 那里的答案与 Lightmatter 的答案不同。 您必须问自己的问题之一是您是否希望您的存储库位于本地或云端。 在像 Google(可能还有 AMD)这样的公司,他们希望将存储库部署在本地。 他们感觉更安全,感觉一切都在他们的掌控之中。 在像 Lightmatter 这样的小公司,我不一定关心。 我对云的安全性感到满意,因此我可以在云中拥有一个存储库。 在较小的背景下,在云中拥有存储库意味着我们几乎将云用作完整的基础设施。 和我本地的一样。 这是第一个问题。 第二个担忧是遗产。 有些公司有遗留的解决方案,当您尝试从遗留解决方案迁移到基于云的解决方案时,您确实必须了解您将获得什么,这说明了本小组的目标。 我们试图指出您在灵活性、能够拥有更新的机器等方面获得的好处。真正重要的是其中一些工作负载,您可以在其中进行大量并行运行。 您想要管理大量正在运行的服务器和作业,这就是您应该选择云的地方。 您可以让您的工作负载利用这一点。 然后,回到数据流,你有一个约束,然后你必须做出决定。 我们决定在云中拥有物理设计的存储库,但其他公司还没有。 我知道公司有更多。 他们仍然在本地完成了大量物理设计,因为他们需要大量存储并且不需要那么多机器。 因此,您必须查看每个案例并根据您的情况做出决定。

图拉加: 我们的许多中小型客户初创公司不希望在本地存储库。 他们没有遗留数据中心问题,因此他们真正完全拥抱云。 一些拥有庞大本地基础设施的大型公司已经开始转向混合型模式。

SE:不同供应商在云中提供的实例类型数量惊人,而且许可成本尚未针对云进行优化,用户如何改进选择正确类型的实例来运行作业的方式?

约翰逊: 这是我们试图解决的基本问题之一。 我们的想法是,对于像 AMD 这样的公司来说,他们主要希望管理自己的基础设施,并以自己的特定方式对其进行优化,他们希望我们帮助做出特定于应用程序的决策,围绕哪些类型的实例和多少内存量工作效果最好,也许还有工作负载本身的配置。 他们如何管理作业运行以获得最佳性能? 我们尝试将所有这些打包成我们称之为飞行计划的东西。 我们为流程的各个部分提供了这些飞行计划以及基线建议。 如果客户想使用它,那就太好了。 如果他们想借鉴这一点并从中改进,我们也可以。

艾特肯:  Synopsys 视图是相同的,但也依赖于您正在执行的特定设计。 有些设计只是需要比其他设计更大或更高的实例。 根据您的特定工作流程,某些实例会比其他实例更有意义或更不有意义。 此外,这不仅仅是许可成本。 您还必须权衡云中的机器成本。 更大的机器更昂贵,但也许您可以在较小的实例上运行工作负载更长时间,并支付更多的许可费用,但少于计算费用。

咳嗽: 我们的重点是根据实际运行情况来看待它。 这是预检运行吗? 通过预签入,您希望运行速度更快且延迟更低,因此您可以获得真正高性能的实例。 难道是一夜之间的回归? 在这种情况下,我不一定关心它完成的速度有多快。 它只需要在一夜之间完成,所以这意味着我可以为我的一夜回归支付更便宜的实例费用。 我们与云提供商合作,找出运行此类作业的最佳实例。 接下来就是优化成本的问题。 您确实希望将成本保持在尽可能低的水平,因为正如我所说,它的增加速度非常快。 我们会查看每个特定的工作负载并询问“该工作负载所需的实例类型是什么?” 同时,它确实变得很困难,因为您必须管理每个作业的实例池,然后确保您有足够的可用实例池,以便当该作业实际启动时,它以合理的速度运行大体时间。 当您开始部署时,您必须解决这些问题。

图拉加: 多年来,我们开发了一些最佳实践。 最初,当您不确定要使用哪种实例类型时,您可以选择在计算和内存之间取得平衡的实例类型或通用实例类型。 但是,当您查看不同类型的工作负载和验证时,您需要更多的内存。 时机也是如此。 您需要更多内存。 对于 CFD 分析,您可能需要 GPU。 这些是我们开发并与客户分享的最佳实践的一部分。

时间戳记:

更多来自 半工程