设备的功耗受到设计、开发和实施过程的每个阶段的影响,但确定节能机会不再仅仅是提高硬件效率。
工具和 方法 从 RTL 到实施,大部分节能机会都已经到位,并且部分半导体行业已经在使用它们。 两者都被认为是成熟的,定义权力意图的标准也是如此。
额外电力和能源节省的巨大机会仍然存在,但其中许多涉及质疑世代和许多实施节点盲目接受的系统级决策。 其中一些决定需要重新考虑,因为它们阻碍了更大、更复杂设计的构建。
“组合中有三骑士——电力、能源和热能,”数字与签核集团产品管理总监 Rob Knoth 说。 Cadence公司. “他们一直都在那里,权力可能是最突出的,但在过去几年里,能源已经走到了最前沿。 现在我们看到热现象出现了。 它们都很有趣,因为您可以使用特定工具在流程中的特定点攻击它们。”
这就是一个问题。 “架构师的两难境地是,您需要低级信息来进行早期估算,” 动脉IP. “这个困境从未得到解决,而且在我的职业生涯中可能也不会得到解决。 为了尽早做出架构决策,我们需要一套信息,一套工具,一套能力来支持这些决策。 我们需要尽早做出这些决定,但也需要它们尽可能准确地反映实施效果。”
除此之外,功率不能表示为单个数字。 有些人担心总能量,因为这可能会影响电池寿命。 其他人更关心峰值功率,因为这可能会导致芯片运行问题,或者随着时间的推移可能会产生热问题。
要进行分析,您需要准确了解系统将如何使用。 Innergy Systems 的创始人兼首席执行官 Ninad Huilgol 说:“想象一下,你有一个包含 100 个不同模块的 SoC。” “它们都在相互作用,你不知道它们将如何预先产生功率密度峰值。 当你有一个正在运行的模拟时,它们都会相互作用,突然产生一个功率密度峰值。”
不同的市场正在关注不同的方面。 Cadence 的 Knoth 说:“边缘 AI 或边缘智能与数据中心超大规模计算类型的应用程序有不同的关注点和不同的问题。” “然而,他们俩都将推动技术的某些方面,其中一些相互加强,其中一些是独立的。 由于电池寿命,Edge 将更加关注能源的某些方面。 考虑在软件中运行什么与在硬件中运行什么是至关重要的。 您将什么信息传回您的基站,让他们运行并发回给您? 有一些非常棘手的问题,物联网行业特别适合领导和创新。 这并不意味着他们是唯一的领导者。 开发大规模超大规模计算数据中心的人们在一个完全不同的类别中处于领先地位。 通常,他们是最努力的人,因为你会看到部署该计算所需的大量基础设施资金。”
RTL 和实现技术
节能技术已应用于 RTL 和实现级别多年,但还有进一步节能的可能。 在 履行 水平,更新的技术正在增加问题,如果不解决这些问题,将导致电力被浪费。
“技术合谋使可靠地提供电压变得更加困难,”产品营销总监 Marc Swinnen 说。 安思. “你会有一些压降,通常人们只是建立一个余量,说我可能会看到高达 100 毫伏的压降。 然后我的时间安排必须假设每个单元格都可能慢得多。 显然不是每个电池都会看到最大电压降,所以您对实际电压降的建模越准确,您设计配电网络以避免此错误的准确性就越高,并且您可以从这个电压降余量中退缩. 你试图降低这个利润率,这会产生巨大的影响。”
在中国、德国、意大利、韩国和美国的 逆转录水平, 时钟门控 和 电源门控 已经使用了很长时间。 虽然他们优化了与定义的任务相关的功率和能量,但它们没有做任何事情来帮助确定任务是否在执行功能的功率方面是最佳的。
“我们有一个术语叫做理想功率,”Knoth 说。 “这是一种识别浪费活动的尝试。 例如,如果您有一个时钟自由运行的块,并且它实际上处于重置状态,则您可以对该时钟进行门控。 我们可以分析该块内部发生的切换,将由于该层次结构中的这些切换而产生的功率相加,然后在报告中显示这些功率,以显示功率被浪费的地方。 使用这种方法,我们看到硬件工程师从设计方法的角度改进了他们正在做的事情。 还有一大堆其他更深层次的擦洗技术可以使用。”
查看 RTL 可以提供其他可能的功耗节省。 Ansys 的 Swinnen 说:“强大的艺术家会通过观察您的工作方式来建议对您的 RTL 进行编辑。” “可能是你以这种方式实现了一个功能,但如果你以不同的方式实现相同的功能,你将节省电力并实现相同的功能。 有一个优化库将自动扫描 RTL 并识别每个可以将 RTL 升级为更节能的实现的地方。 它会告诉你它会根据估计节省多少电量,如果你同意,它会实际实施。”
早期估计
很少有人会争辩说,越早评估权衡,它们可能产生的影响就越大。 Knoth 说:“你的范围越广,参与谈判的各方越多,你越早退一步审视它,你就越能开始看到更大的机会。” “这些是更大的趋势,不仅仅是让你生产的一个小部件变得更好。 你真的必须看看这个小部件如何适合小发明,它适合连接到水力发电厂或太阳能农场的数据中心的产品。”
问题是,如果估计不够准确,也有可能做出错误的决定。 Schirrmeister 说:“随着设计变得越来越大、越来越复杂,做出准确的估计也变得越来越困难。” “例如,您需要布局规划信息来估计硅片路径中需要多少寄存器,因为在大芯片尺寸上传播信号非常困难,无法在一个时钟周期内完成。 对于 NoC,我们尝试优化寄存器的数量,这会影响功耗和芯片上的互连数量。 我们注释,从 .lib,一直回到 NoC 生成,早期估计路径的长度。 以后是不是还要细化? 绝对地。 问题的多维现实使其变得非常困难,尤其是在存在垂直依赖性的情况下。”
为了能够执行热分析,必须考虑较长的时间范围,并且您必须查看实际的工作负载。 这很可能意味着运行实际的软件。 “大多数行业使用映射到仿真器的 RTL 代码,在该平台上运行真实的软件工作负载,并从中获取矢量,然后进行功耗估算,”Knoth 说。 “通过每天多次迭代,他们可以调整软件以更有效地使用硬件中的电源功能。 一夜之间,他们就能够对硬件进行调整。 现在你有了这种系统级的协同优化,你可以在其中寻找浪费的功率并确保你正在创建尽可能最佳的系统。”
业界一直在寻找插入抽象模型而不是使用 RTL 的方法,这既是因为它可能运行得更快,也是因为可以在 RTL 准备就绪之前执行分析。 “到目前为止,分析软件执行的功耗一直是在仿真平台上进行的,” Innergy 的 Huilgol 说。 “一种有用的技术是构建可以在软件环境中模拟的硬件电源模型。 这些模型可以在软件运行时提供有关各种硬件模块的平均和瞬时功耗的准确反馈。 这可以在流片前实现硬件和软件的功耗协同优化。”
过去对硬件和软件的功能验证采用了类似的方法,现在正在尝试将其应用于电源。 “我们不是在发明黑魔法,我们也无法对抗物理学,”Huilgol 说。 “但你不需要一直运行详细的功率模拟。 我们在块级别进行微小的采样,将它们组合在一起并在子系统级别、系统级别、仿真、软件等运行。有两个方面的电源。 一个是数据路径,另一个是控制路径。 我们主要考虑控制路径,但是当存在数据路径依赖性时,我们的模型中有一个工具可以让它们了解数据路径。 这些是在事务模型上运行的统计功率模型。 你如何提高分辨率? 您可以有更小的周期或单个周期。 但如果你的解决方案是 15 个周期或更多,相当大的交易,就会有一些统计错误被捕获。”
反思过去
过去,摩尔定律使得从一个节点迁移到下一个节点非常容易,利用额外的门、更高的性能和更低的功耗。 这意味着跨时间的连续性很重要,尤其是要确保现有软件能够继续在新硬件上运行。
随着时间的推移,这已经导致一些难以摆脱的低效率问题。 “很多事情在过去是不可能的,”Knoth 说。 “也许是因为工艺节点无法容纳将部署在边缘的半导体中的所有计算。 但现在可以了。 也许您没有工具在正确的时间内以正确的准确性进行分析,或者因为封装技术不可用。 但时不时地,你必须喘口气,退后一步,重新审视风景,并问自己,“我们是否正确地优化了这个方程式,或者我们是否只是尽力而为?” 有时我们需要戴上科学家的帽子,不要害怕质疑我们制定的一些基本原则。”
考虑集成的复杂性很重要。 Schirrmeister 说:“复杂性有两个级别——应用程序复杂性上升到最高,然后实施复杂性下降到半导体技术。” “那是我们正在处理的晶体管数量。 因为你有应用程序的复杂性,随着功能的数量不断增加,而且还在不断增加,你必须处理共享内存、一致性等问题。 如果你没有缓存,你总是需要移动东西。 缓存一致性是解决引入新问题的问题。”
处理器一直受性能驱动。 “向处理器添加分支预测器或推测执行会增加电路中门的数量,从而增加动态和静态功耗,”Catapult HLS 团队的项目总监 Russell Klein 说。 西门子EDA. “但这些功能提高了处理器上运行的计算性能。 所以功率肯定会上升,但是能量,即功率乘以执行计算所需的时间,可能会上升或下降。 这取决于性能增加与功率增加的比率。 比如说,如果功率增加 20% 但性能仅提高 10%,则计算的总能量会增加。”
功率、能量和热量不能总是以简单的方式进行优化。 “这似乎违反直觉,但提高性能可以降低某些工作负载的平均能耗,”Lightelligence 工程副总裁 Maurice Steinman 说。 “此类工作负载可以受益于所谓的‘闲置竞赛’,如果可以更快地完成工作,则可以在更长的时间内进入深度节能状态。 考虑保持可预测(但利用率低于 100%)计算需求概况的工作负载,比如 25% 的可用性能。 一种方法可以将工作频率降低到 25%(并相应地降低工作电压)。 该设备现在将保持完全活动状态,但功率会降低。 另一种方法将努力快速完成工作,从而实现大幅节能——开启 25%,关闭 75%,其中关闭可能需要零或接近零的能耗,从而导致平均功耗低于 25% 时钟速率下的恒定运行。 甚至可能有利于超频/过压,进一步将关断时间提高到 75% 以上。”
平衡硬件和软件
与系统复杂性和功率相关的最大平衡技巧之一是建立硬件/软件边界。 “在软件中实现的任何功能都将比在硬件中实现的等效功能慢几个数量级,”西门子的 Klein 说。 “根据定义,软件中的任何东西都不是最优的。 在非常高效的处理器上高度优化的软件无法达到即使是糟糕的硬件实现的效率。”
分区决策变得越来越容易,Klein 说,“什么应该留在软件中,什么应该在处理器上完成,以及创建一个作为该处理器的 sidecar 的定制硬件加速器更有意义的东西——这就是你开始看到巨大的100 倍、1,000 倍的时间或功率减少,具体取决于您优化系统的位置。”
随着性能改进变得越来越困难,这些方法变得必不可少。 “归根结底,更大的处理器能效更低,因此只有在您不关心功耗的情况下,使用更大的处理器来满足您的性能需求才有意义,”Klein 说。 “正确的答案是将繁重的工作从 CPU 移到定制的加速器中。”
这种方法越来越受欢迎。 “专用硬件加速器和协处理器可以提高系统的性能,因为迁移到更先进的节点后性能增益会减少,”IP 销售和营销副总裁 Andy Jaros 说。 弹性逻辑. “专用加速器减轻了 CPU 的处理负担,因为它需要花费巨大的计算周期来执行复杂的算法。 将 eFPGA 用于这些专用硬连线加速器可提供所需的能效,但在工作负载发生变化时仍能保持可编程性。”
只要您可以专攻,就会有巨大的获利机会。 Schirrmeister 说:“如今,通过添加指令来专门化处理器变得容易多了。” “大多数这些指令定制都是为了低功耗而完成的。 我见过这样的情况,在处理器中添加一条指令可以让您保留一半的内存。 从功率的角度来看,这是巨大的。 但是当你在孤岛上这样做时,你要做的事情的整体复杂性已经增加了。”
或者您可以将该功能一直移动到硬件中。 “另一种解决方案是将计算复杂的操作卸载到定制的加速器中,”克莱因说。 “高级综合 (HLS) 是执行此操作的简单方法。 它仍然是硬件设计,所以你仍然需要聪明的工程师来让它工作。 但是对于 HLS,您是从软件 C 或 C++ 算法开始的。 没有对算法的解释,这是一个缓慢且容易出错的手动过程。 并且可以从软件中以原始功能的形式轻松获得黄金参考,这使得验证变得容易得多。”
所有这些选择都变得更加容易。 Schirrmeister 说:“过去,在架构级别做出决策的最大问题是您必须在项目后期重新评估该决策,但流程并不相关。” “对于可配置处理器和 NoC 等情况,流程已经连接。 如果你回去,重新运行这些工具需要时间,但不再需要人们手动验证架构决策。 自动生成允许您运行更多的数据点。”
结论
单独优化电力、能源或热问题并不容易。 但是解决这三个问题中的每一个问题的需求都在增长,虽然它们相互关联,但要确定应该优化哪些或如何优化并不总是那么容易。 只有查看整个系统才能做出决策。 过去,建模、分析和设计流程使这变得更加困难,尤其是当它跨越硬件/软件障碍时,但现在出现了更多工具。 这仍然不容易,但随着行业意识的提高和更多人想要解决这个问题,将会出现更好的工具和流程。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- 使用 PREIPO® 买卖 PRE-IPO 公司的股票。 访问这里。
- Sumber: https://semiengineering.com/holistic-power-reduction/
- :具有
- :是
- :不是
- :在哪里
- $UP
- 1
- 100
- 100x
- 15%
- a
- 能力
- Able
- 关于
- 绝对
- 摘要
- 加速器
- 加速器
- 公认
- 因此
- 账号管理
- 精准的
- 准确
- 横过
- 要积极。
- 活动
- 实际
- 通
- 加
- 添加
- 添加
- 额外
- 地址
- 解决
- 高级
- 有利
- 怕
- AI
- 算法
- 算法
- 所有类型
- 缓和
- 允许
- 单
- 已经
- 还
- 时刻
- 量
- an
- 分析
- 分析
- 和
- 另一个
- 回答
- 应用领域
- 应用的
- 使用
- 的途径
- 方法
- 批准
- 建筑的
- 架构
- 保健
- 争论
- 围绕
- 艺术家
- AS
- 方面
- 相关
- At
- 攻击
- 尝试
- 自动化
- 自动
- 可使用
- 避免
- 察觉
- 意识
- 背部
- 坏
- 屏障
- 基地
- 基于
- 电池
- 电池寿命
- BE
- 因为
- 成为
- 成为
- 很
- before
- 作为
- 得益
- 最佳
- 更好
- 超越
- 大
- 大
- 黑色
- 盲目
- 阻止
- 吹氣梢
- 都
- 分支机构
- 午休
- 气息
- 带来
- 更广泛
- 建立
- 建筑物
- 束
- 负担
- 商业
- 业务发展
- 但是
- by
- C + +中
- 缓存
- 被称为
- CAN
- 不能
- 帽
- 关心
- 携带
- 例
- 原因
- Center
- 中心
- CEO
- 一定
- 更改
- 芯片
- 选择
- 程
- 时钟
- 码
- 编纂
- 结合
- 如何
- 通信
- 完成
- 完成
- 复杂
- 复杂
- 计算
- 计算
- 关心
- 已联繫
- 考虑
- 考虑
- 常数
- 施工
- 消费
- 继续
- 继续
- 控制
- 可以
- 中央处理器
- 创建信息图
- 创造
- 危急
- 交叉
- 习俗
- 周期
- 周期
- data
- 数据中心
- 数据中心
- 数据点
- 天
- 处理
- 处理
- 决定
- 决定
- 专用
- 深
- 更深
- 定义
- 定义
- 无疑
- 需求
- 密度
- 根据
- 依靠
- 部署
- 设计
- 设计
- 详细
- 确定
- 发展
- 研发支持
- 设备
- DID
- 不同
- 难
- 数字
- 副总经理
- 屏 显:
- 分配
- do
- 不会
- 做
- 美元
- 完成
- 别
- 向下
- 驱动
- 下降
- 两
- 动态
- 每
- 此前
- 早
- 更容易
- 易
- 边缘
- 只
- 影响
- 效率
- 高效
- 使
- 使
- 努力
- 能源
- 能源消费
- 工程师
- 工程师
- 更多
- 确保
- 保证
- 进入
- 整个
- 环境中
- 错误
- 特别
- 必要
- 建立
- 评估
- 估计
- 等
- 醚(ETH)
- 评估
- 甚至
- 所有的
- 究竟
- 例子
- 执行
- 执行
- 现有
- 额外
- 诊所
- 农场
- 快
- 特征
- 反馈
- 少数
- 部分
- 战斗
- 适合
- 流
- 流动
- 聚焦
- 针对
- 第一线
- 申请
- 向前
- 创办人
- 创始人兼首席执行官
- Free
- 频率
- 频繁
- 止
- 充分
- 功能
- 实用
- 功能
- 根本
- 进一步
- 收益
- 门控
- 盖茨
- 代
- 代
- 越来越
- Go
- GOES
- 去
- 金色的
- 团队
- 成长
- 成长
- 民政事务总署
- 半
- 硬
- 硬件
- 硬件设计
- 有
- 有
- 重
- 举重
- 帮助
- 等级制度
- 更高
- 高度
- 整体
- 创新中心
- 但是
- HTTPS
- 巨大
- 狩猎
- i
- 理想
- 鉴定
- 确定
- 空闲
- if
- 影响力故事
- 实施
- 履行
- 实施
- 重要
- 改善
- 改善
- 提高
- 改善
- in
- 增加
- 增加
- 增加
- 增加
- 日益
- 令人难以置信
- 行业中的应用:
- 影响
- 信息
- 基础设施
- 创新
- 代替
- 说明
- 积分
- 房源搜索
- 意图
- 相互作用
- 互动
- 互联
- 有趣
- 解释
- 成
- 推出
- 涉及
- 物联网
- IP
- 岛
- 孤立
- 问题
- IT
- 迭代
- 只是
- 知道
- 景观
- 大
- 大
- 最大
- 名:
- 后来
- 法律
- 铅
- 领导者
- 领导
- 左
- 减
- Level
- 各级
- 自学资料库
- 谎言
- 生活
- 一生
- 翻新
- 喜欢
- 容易
- Line
- 长
- 长时间
- 不再
- 看
- 看着
- 寻找
- 占地
- 低
- 制成
- 魔法
- 主要
- 保持
- 维护
- 使
- 制作
- 制作
- 颠覆性技术
- 方式
- 手册
- 手动
- 许多
- 余量
- 营销
- 市场
- 大规模
- 成熟
- 最多
- 可能..
- 意味着
- 手段
- 意思
- 内存
- 研究方法
- 迁移
- 模型
- 造型
- 模型
- 模块
- 更多
- 更高效
- 最先进的
- 移动
- 移动
- 许多
- 多
- 乘以
- my
- 需求
- 打印车票
- 需要
- 网络
- 决不要
- 全新
- 新硬件
- 下页
- 没有
- 节点
- 节点
- 没什么
- 现在
- 数
- of
- 折扣
- 经常
- on
- 一
- 那些
- 仅由
- 操作
- 操作
- 操作
- 操作
- 运营
- 机会
- 最佳
- 优化
- 优化
- 追求项目的积极优化
- or
- 秩序
- 订单
- 原版的
- 其他名称
- 其它
- 我们的
- 输出
- 超过
- 最划算
- 过夜
- 包装
- 各方
- 过去
- 径
- 高峰
- 员工
- 演出
- 性能
- 也许
- 透视
- 物理
- 地方
- 地方
- 平台
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 声望
- 可能
- 或者
- 功率
- 可预见
- 预报器
- 呈现
- 总统
- 预防
- 原则
- 大概
- 市场问题
- 问题
- 过程
- 处理
- 处理器
- 处理器
- 生产
- 产品
- 产品管理
- 本人简介
- 曲目
- 项目
- 突出
- 提供
- 提供
- 目的
- 推动
- 放
- 题
- 有疑问吗?
- 很快
- 率
- 比
- 准备
- 真实
- 现实
- 现实
- 真
- 减少
- 减少
- 减少
- 精
- 反映
- 寄存器
- 加强
- 有关
- 留
- 报告
- 要求
- 必须
- 分辨率
- 解决
- 导致
- 右
- 抢劫
- 运行
- 运行
- 销售
- 销售和营销
- 同
- 保存
- 保存
- 储
- 对工资盗窃
- 说
- 说
- 浏览
- 科学家
- 范围
- 看到
- 看到
- 似乎
- 看到
- 半导体
- 提交
- 感
- 分开
- 集
- 共用的,
- 应该
- 显示
- 作品
- 信号
- 硅
- 简易
- 模拟
- 单
- 尺寸
- 放慢
- 小
- 智能
- So
- 软件
- 太阳的
- 方案,
- 解决方案
- 一些
- 专攻
- 具体的
- 投机
- 阶段
- 标准
- 开始
- 开始
- 州
- 站
- 统计
- 留
- 步
- 仍
- 建议
- 供应
- SUPPORT
- 系统
- 产品
- 表
- 滑车
- 采取
- 需要
- 任务
- 任务
- 团队
- 技术
- 技术
- 专业技术
- 展示
- 条款
- 比
- 这
- 该座
- 景观
- 其
- 他们
- 然后
- 那里。
- 在其中
- 热
- 博曼
- 他们
- 事
- 认为
- Free Introduction
- 那些
- 三
- 通过
- 次
- 时
- 定时
- 至
- 一起
- 工具
- 最佳
- 合计
- 交易
- 交易
- 巨大
- 趋势
- 尝试
- 二
- 类型
- 下
- 独特地
- 直到
- 升级
- 上
- 使用
- 用过的
- 运用
- 利用
- 各个
- 企业验证
- 确认
- 与
- 垂直
- 非常
- 副总裁
- 电压
- 想
- 是
- 方法..
- 方法
- we
- 为
- 什么是
- ,尤其是
- 这
- 而
- 全
- 将
- 也完全不需要
- 工作
- 将
- 年
- 但
- 您
- 您一站式解决方案
- 和风网
- 零