图/MLCommons
ML基准测试套件MLPerf最新推论评比在9月22日出炉。Nvidia首度以GPU搭配不同CPU架构来参加MLPerf Inference v1.1的测试,比较两种组合在6种AI应用中的成效。实际结果显示,搭配Arm架构的A100效能与搭配x86架构相差无几,仅略低于x86架构的效能,但在医疗影像识别评比中,Arm架构效能更胜过x86架构。
MLPerf推论评比共分为6种AI应用,分别是用于推荐的DLRM框架、用于NLP的BERT、用于语音辨识的RNN-T、用于医疗影像辨识的3D U-Net、用于影像分类的ResNet-50 v1.5,以及用于低解析物件侦测的SSD搭配MobileNet-v1、用于高解析物件侦测的SSD搭配ResNet-34。
Nvidia指出,相较于去年MLPerf Inference v0.7的推论评比,A100 GPU在这次v1.1版本的评比中,于各项AI应用的效能均有所提升,尤其在语音识别与医疗影像识别的领域,效能更分别较去年提升了3成与5成。Nvidia AI推论与云端部门的产品经理Dave Salvator指出,这些效能的提升,并非基于硬件的改良,而是来自于软件对于硬件效能的优化。
MLPerf推论评比又可依据在云端或边缘端运算,分为两大评比类别;而在云端资料中心进行推论的类别,又可分为完全无延迟的离线运算(Offline)与低延迟的服务器运算(Server)。在云端资料中心的测试中,若以A30 GPU为基准,来比较单一加速器(Accelerator)的效能,可以发现A100 GPU效能几乎领先了所有加速器。
进一步来看,这次领先的A100 GPU分别搭配了x86架构与Arm架构的CPU。评比结果显示,搭配Arm架构的A100效能仅略低于搭配x86架构的效能,其中在离线的云端推论类别,Arm架构服务器在医疗影像AI的推论效能,更胜过x86架构。
Nvidia在今天发布的部落格指出,全球资料中心正在加速采用Arm架构,因Arm架构具有低耗电、高效率与高效能的优势,还有持续扩展的软件生态系统。在这个趋势下,Nvidia提交Arm架构的A100服务器来参加MLPerf推论评比,评比成果更显示,基于Arm的GPU加速平台,已经准备好处理资料中心的各种AI工作负载。
评比结果显示,搭配Arm架构的A100效能略低于搭配x86架构的效能。
除了在云端推论评比取得领先地位,在边缘端的推论评比上,Nvidia也以A100 PCIe取得了最佳成绩。若以Nvidia嵌入式边缘运算芯片Jetson Xavier NX的效能为基准,可以发现A30与A100 PCIe遥遥领先其他芯片效能,尤其A100 PCIe在医疗影像识别、NLP与高解析物件侦测等推论成效,大幅领先其他芯片。
Dave Salvator也特别强调软件在推论评比中扮演的加速角色。在AI推论上,Nvidia靠深度学习推论软件开发套件Tensor RT来最佳化AI模型,透过稀疏性与量化感知训练两大功能,在不影响推论准确率的情况下,缩减模型权重与精度,来加快模型运算效率。
同时,Nvidia也透过开源推理软件Triton,简化AI模型在生产环境的大规模部署。Dave Salvator解释,Triton主要可以自动化基础架构的管理,具有弹性化扩展(auto scaling)及负载均衡(Load balancing)两大功能,尤其将AI模型部署到推论环境中执行时,对于运算资源的需求可能突然来到高峰,若运算资源已经饱和,就会延长模型推论时间。但透过Triton,当运算需求突然增加时,可以自动将工作分配到闲置的CPU资源上执行,最佳化利用CPU或GPU,来加速模型推论。
Dave Salvator也揭露一张图表,比较使用Triton来部署AI模型,以及透过客制化程式码来部署AI模型的效能差异。Nvidia指出,使用Triton的A100推论效率,可以达到客制化程式码的93%,使用Triton的A30更可达到与客制化程式码相同的成效。
在这项推论评比中,Nvidia也运用多实例GPU(Multiple Instance GPU,MIG)来进行评比,MIG可以将每个A100 GPU最多分为七个执行实例,各自独立且具备个别的内存、快取和运算核心,来执行不同的AI工作负载。由于MLPerf推论评比只有六项应用,Nvidia还多执行了一个影像分类的AI应用,将7项应用同时在A100中执行。得到的结果是,每项工作负载的推论效能均达到独立执行的95%。Dave Salvator指出,能达到这个成果,Triton功不可没,因为Triton可以让不同框架的多个模型同时在单一GPU或CPU上执行,而不需增加额外的程式码。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步2024-06-28 09:27:13
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15