图/Nvidia
Nvidia 7月20日发布了新一代的深度学习推论软件开发套件TensorRT 8,比起前一代TensorRT 7,TensorRT 8能将推论时间缩短一半、推论准确性提升一倍,Nvidia宣称,以TensorRT 8最佳化超大Transformer模型BERT-Large,并部署在V100上执行,只要1.2毫秒就能完成推论,比TensorRT 7快2.5倍。而大幅提升效能的关键,就是TensorRT 8套件中的稀疏性(Sparsity)与量化感知训练(Quantization aware training,QAT)两大功能,前者透过减少运算来加速推论,后者则让模型能以INT8精度来进行推论,却不会损失推论的准确性(accuracy)。
TensorRT是Nvidia在2016年底推出的深度学习推论软件开发套件,主要包含两部分,分别是用来进行调校的深度学习推论最佳化工具,以及能执行深度学习推理应用程序的Runtime,使用者可以将训练好的神经网络输入TensorRT中,产出经过最佳化的推理引擎。可支援包括TensorFlow、Pytorch、ONNX在内的多种深度学习框架,可最佳化的神经网络包括CNN、RNN与Transformer。可部署在资料中心、边缘端、嵌入式平台等任何Nividia的平台中。
Nvidia最新发布的TensorRT 8,更强调在语言相关应用的效能进展,能将模型推论速度加快一倍,尤其在一些需要大量参数的模型上,如搜索引擎、广告推荐、聊天机器人、对话式AI等应用,Nvidia解释,因为这类模型通常具有更大量的参数,更不易在边缘端进行推论,尤其在训练完模型并部署到边缘装置时,可能面临内存与算力不足问题,此时,开发者可能就得缩减模型的大小来进行推论,但准确率也随之下降,若要维持准确率不变,就可能产生运算速度不足的问题。
因此,Nvidia在TensorRT 8透过了两大关键功能,来加快模型推论的效能。一为稀疏性(Sparsity),这是Nvidia去年在Ampere架构GPU中新增的一项技术,主张模型中并非每个权重都同等重要,若将不影响准确率表现的权重调整为零,就能在尽可能维持模型准确度不变的同时,减少不必要的运算,进而减少内存和带宽的用量,来加快模型推论速度。Nvidia在过去一篇部落格文章中更比喻,稀疏性的作用,就像是玩乐高积木时,抽走几块积木后,仍可以不影响整体高度。
另一项功能则是量化感知训练。由于更低精度的模型,可以加速模型推论的时间,这项技术目的要将主要以浮点(Floating Point)来进行计算的模型(大多为FP32),以更低精度单位INT8来进行模型推论,并尽可能维持推论的准确性。这项技术可以显著减少运算与储存资源的消耗,提升处理核心(Tensor Core)的推论效能。
Nvidia开发者部落格也曾介绍,这项技术需要在模型训练过程中,就透过修改训练图(training graph)来模拟低精度的行为,引入量化误差作为训练损失的一部分。也就是说,QAT是透过在模型训练期间对量化误差进行建模,借此来减轻部署时,降低精度对于模型推论准确性的影响。
TensorRT推出后下载近250万次,使用者来自医疗保健、汽车、金融和零售等领域的27,500家企业,前一代TensorRT 7,更被运用在Nvidia几个月前提交给MLPerf的推论评比中,以软件辅助硬件提升模型运算效能,Nvidia表示,这项软件是Nvidia GPU运算平台在各项评比名列前茅的一大助力。
TensorRT不只可以用来最佳化基于Transformer的模型效能,也可用于其他从电脑视觉、医疗影像、推荐系统、对话式AI、语音辨识、语意理解、语音生成(Text to Speech)等应用的模型。比如GE Healthcare,就将TensorRT用在超音波的机器视觉推论上。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步2024-06-28 09:27:13
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15