AI 行业的性能基准 MLPerf 首次也测量了机器学习消耗的能量

2026-02-07 0 447

AI 行业的性能基准 MLPerf 首次也测量了机器学习消耗的能量

每隔几个月,人工智能行业就会对最新的机器学习计算机系统进行一次测试

该会议已持续数年,通常关注由 Nvidia 和 Qualcomm 等芯片供应商及其合作伙伴(如戴尔)组装的多处理器计算机的最佳性能,并根据一组基准测试任务进行衡量 例如目标检测和图像分类。

今年,bake-off 有了一个新的转折点:检查这种大规模并行计算机系统的能源消耗,以此作为产品能效的一种代表。

测试 MLPerf 现在增加了行业标准测量值,用于衡量我们为给定任务消耗的焦耳电量(以瓦特为单位)。

这项工作是 MLCommons 的执行董事 David Kanter 领导的大约一年半努力的结果,MLCommons 是负责监督 MLPerf 的行业联盟,

“我真正感到兴奋的一件事是 MLPerf 功率项目,这就是我们如何进行全系统功率测量,”坎特在新闻发布会上讨论了 MLPerf 结果,该结果于周三通过新闻发布 .

正如该组织所说,Power Project 测量“整个系统在执行性能基准时消耗的平均交流功率(和隐式能量)”。

因此,由一定数量的芯片组成的给定计算机将被指定为在给定任务的给定每秒查询性能速率下“平均”任务的给定瓦特数或焦耳数。

测量的系统是服务器计算机或边缘计算机。 服务器计算机将包括戴尔 PowerEdge 服务器等系统,配备两个英特尔至强处理器和四个运行大部分人工智能工作的 Nvidia T4 加速器。

相比之下,边缘计算机可以是带有一个基于 ARM 的 Cortex-A72 处理器但没有加速器的 Raspberry Pi 机器,或者是带有一个 Nvidia“Carmel”加速器芯片的 Nvidia Jetson AGX Xavier 服务器。

MLPerf 数字从不报告提交内容的优越性,而是提供包含结果的电子表格并让其他人得出自己的结论。

MLPerf 这次有 16 个提交者,包括英伟达、高通、戴尔、初创公司 Krai 和富士通。 并非每个提交都提供功率测量,但 MLCommons 总共能够获得 850 种不同的测量结果。

根据报告的瓦数和性能,需要一些算法来得出有关机器能效的结论。

例如,在使用 ResNet 处理 1500 万个 ImageNet 数据集的机器类别中,将每秒查询次数除以总瓦数表明高通系统使用两个 16 核 AMD Epyc 处理器和五个高通云 AI 100 处理器每次查询的瓦数最低,每次查询 0.0068 瓦。 戴尔的系统是一个配备英特尔处理器和 Nvidia T4 芯片的 PowerEdge,每次查询耗电量为 0.036 瓦。

消耗的能量和速度方面的性能通常是权衡取舍的:一个可以优化一个而降低另一个。 系统制造商在构建计算机时必须考虑这两个因素,牢记允许系统消耗多少能量,以及它应该以多快的速度完成工作。

在实践中,计算机通常被调整为优化其中之一,性能或能源效率,而不是真正平衡两者。

“总的来说,如果你看一下大多数硅技术,就会发现电压和频率之间存在权衡,”坎特在新闻发布会上这样描述此事。 “一般的经验法则是,当你的电压上升或下降时,这将倾向于通过电压变化的平方来驱动功率上升或下降。” 通常会提高电压以提高时钟频率的性能。

这些测试允许提交的公司使用他们自己的神经网络算法版本,或者使用标准模型,与其他人一样。 因此,例如,在第一种情况下,称为“开放”,供应商可能会提交运行 Mobilenet 的结果,Mobilenet 是一种资源高效的网络卷积神经网络,由 Andrew G. Howard 及其在谷歌的同事于 2017 年推出。 在“封闭”组中,每个人都会使用已经使用多年的标准 ResNet 卷积神经网络。

因此,该报告提供的功率数字不仅反映了机器的能效,还反映了给定神经网络算法的能效。

个人贡献者对能量测量提出了警告。 一方面,芯片的使用量与闲置量(即所谓的总利用率)会影响其能效。

“在边缘进行推理时,你有流数据,你甚至没有使用峰值 TOPS [每秒万亿次操作] 的 10%,同时你消耗了大量静态功率,”Hamid Reza Zohouri,负责人说。 加速器芯片初创公司 EdgeCortix 的产品。 “所以利用率,你如何利用你的芯片,可以发挥很大的作用,有可能获得更好的实际功率效率,因为你不会在已用资源上浪费闲置功率。”

一些供应商告诫说,尽快完成工作仍然是最重要的。

“很多时候,如果有一定数量的工作要完成,那么更快地完成工作通常是一件好事,”NVIDIA 加速计算集团产品营销高级经理 Dave Salvator 评论道。

“在实时应用程序的情况下,问题在于能够实时为您的客户提供服务并达到您的 SLA 并提供出色的用户体验。”

目前,报告的功率数据可能更有助于了解一些最大的神经网络的一般能源消耗习惯。

例如,要使用谷歌的 BERT 语言模型来回答来自斯坦福问答数据集或 SQuAD 1.1 版的问题,这是一个基于维基百科数据的众包问答集,所有系统的平均速度约为 16,398 次查询 每秒回答,处理成本为 2.4 千瓦。 因此,每秒几千瓦是衡量不断回答问题的能源成本的一种方式。

可以想象,定期测量这些数据可以为未来关于 AI 能源成本的讨论提供更好的观点。

本月的基准测试也是 MLPerf 首次作为 MLCommons 的一部分发布,MLCommons 于 12 月首次亮相。

MLCommons 将自己标榜为一个行业-学术合作伙伴关系,其广泛的任务是“推进最新人工智能和机器学习数据集和模型、最佳实践、基准和指标的开发和访问”。

MLCommons 有一个创始委员会,成员包括来自阿里巴巴、Facebook AI、谷歌、英特尔和 NVIDIA 的代表,以及负责哈佛大学边缘计算实验室的副教授 Vijay Janapa Reddi。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 开发教程 AI 行业的性能基准 MLPerf 首次也测量了机器学习消耗的能量 https://www.zuozi.net/56552.html

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务