2021台湾人工智能年会
现今,Google许多服务,几乎都跟AI有关,举凡是搜寻、地图、照片和翻译等等,这些AI应用服务,在训练学习和推论过程中,都使用到了Google的TPU。Google很早就在资料中心内大量部署TPU,用于加速AI模型训练和推论部署使用,甚至不只自用,后来更当作云端运算服务或提供第三方使用,还将它变成产品销售。
在今年线上台湾人工智能年会上,Google研究部门软件工程师Cliff Young担任第一天的主题演讲,Cliff Young不只是Google Brain团队核心成员,更是Google TPU芯片主要设计者,一手设计和打造TPU,部署到Google资料中心内,作为AI硬件加速器,用于各种AI模型训练或推论。在加入Google前,他曾在D. E. Shaw Research和贝尔实验室,负责设计和建造实验室超级电脑。在整场演讲中,他不只亲自揭露Google决定自行开发TPU的过程,针对深度学习革命对于未来AI发展影响,也提出他的最新观察。
Cliff Young表示,深度学习神经网络技术自2009年开始在语音辨识大放异彩以来,几乎每年在不同领域应用上,我们都能看到因为深度学习而有了突破性的发展,从AI影像识别、Al下棋、到Al视网膜病变判读、语文翻译、机器人拣货等等,“这是我们以前从未想过的事。”
正因为,深度学习的出现,让人类在不同领域执行任务的方式产生重大变化,他也以美国知名科学哲学家Thomas Kuhn提出的科学革命的发展模式来形容,深度学习本身就是一种科学革命的典范转移,不只是常态科学。
Thomas Kuhn在《科学革命的结构》一书中提出两种科学发展模式,第一种是常态科学的模式,透过实验和证明来理解新事实的方法,当出现旧科学无法认同的新科学产生时,就会产生新旧科学之间的冲突,衍生发展出另一种模式,也就是第二种的科学革命的模式,在此模式下,新科学模式将彻底颠覆旧科学的作法。“我认为深度学习革命就是这样一种转变, 正在取代传统电脑科学。”Cliff Young说道。
更进一步来说,他指出,深度学习是一种数据驱动的决策过程,不同于传统的stored value 或启发式(heuristic)决策方法 ,深度学习算法使用可观测的数据,来提供人类建立更好地决策的方式,比如运用在使用者推荐,可以根据使用者轮廓或网络行为,来推荐适合的产品或给出最佳搜索结果。
但他也坦言,不像数学原理可以被解释,深度学习模型运作原理目前仍难以解释,也因此,科学家无法从这些为何可行的原因中,找到提高效率的更好的作法。但如果想完全理解和解释深度学习运作原理,依照过往工业革命的发展经验,得等到合成神经动力学的出现后,才有机会得到解释,动辄可能耗费数十年之久,所以,他也说:“从事深度学习研究,比起问why,how更重要。”
Cliff Young回顾机器学习革命过程,可以2012年的AlexNet神经网络架构作为分水岭,由Alex Krizhesky等人提出的AlexNet运用GPU建立的深度学习模型,以85%准确度刷新世界记录,在当年ImageNet图像分类竞赛中一举夺冠。
这项竞赛后来也引起Google的高度关注,认为深度学习技术大有可为,便开始投入研究。但他们投入后发现,深度学习模型在图像识别和分类的成效表现,高度仰赖GPU的浮点运算能力,需要消耗大量运算资源供AI模型做学习训练,因模型训练运用GPU衍生出的运算成本十分昂贵。所以,Google才毅然决定自行开发深度学习专用的处理器芯片,也就是TPU(Tensor processing unit)。
在投入深度学习研究3年后,2015年时,Google开发出第一代TPU处理器,开始部署到自家的资料中心,用于深度学习的模型训练。
Google在2016年Google I/O大会首次揭露TPU,与当时的CPU与GPU相比,Google的TPU不仅能提供高出30~100倍的每秒浮点运算性能,在整体运算效能上也有多达15到30倍的提升,甚至在效能/功耗比获得有将近30~80倍的改善,Cliff Young表示,TPU很可能是当时世上第一个实现以高内存容量的矩阵架构设计完成的处理器。
当年,Google击败韩国棋王李世石的AI电脑围棋程式AlphaGo,背后功臣就是使用TPU运算的服务器机柜,Google Deepmind团队在AlphaGo中采用48个TPU用于AlphaGo的AI下棋推论, 与人类进行棋力比赛。
到目前为止,Google TPU一共历经4代发展演进,从初代TPU仅能应用于推论,到第二代TPU开始加入深度学习模型训练处理能力,对于网络吞吐量需求增高,而随着运算能力的提升,考虑到散热问题,所以新一代TPU开始在散热机制上结合液冷设计,也就是第3代TPU,也因此增加TPU密度,到了最新第4代TPU,则推出无液冷的TPU v4i和采用分散式液冷的TPU v4两种不同版本。
这几年,深度学习硬件加速器越来越火红,Cliff Young认为,在AI训练和推论硬件发展上将出现转变。他预测,未来推论硬件设计上将更具多样性,来发展出不同推理解决方案,来对应不同场景的使用需求,从微瓦的超低功耗,到高效能运算HPC以及超级电脑应用。
另在AI训练硬件方面, 他表示,融合式硬件架构将成为发展主流,尤其现在不少新推出的AI训练硬件,都有不少相似之处,像是在设计高密度运算芯片Die时,会采用HBM(高带宽内存)整合设计,还有建立高效能互连网络,用于传输训练资料,如TPU就有使用ICI(Inter-Core Interconnect)来与其他TPU高速互连,其他还有如Nvidia的NVLink高速互连界面等。虽然这些技术,都来自不同团队,但他们都有个共通之处,就是在研究共同问题想办法找答案,他表示,透过这些技术融合,有机会可以找到好的解决方案。
Google资料中心内目前部署了许多TPU Pod丛集,以上图TPU Pod为例,分上下二层建立TPU Pod丛集,每层配置多台机架式机柜,每台机柜中安装了数十个TPU,包括TPU v2(上排)与 TPU v3(下排),再透过网络线来与其他TPU高速互连。
另一方面,他也观察到,近几年,全球AI竞赛进到白热化阶段,虽然加速深度学习在自然语言模型的突飞猛进,但也使得需要训练的AI模型越来越庞大,像是为了完成使用1,750亿个神经参数的GPT-3文字产生器模型的训练,OpenAI使用1万个GPU建立运算丛集,以 petaflops算力花了 3,640天来训练该模型。
为了训练出像GPT-3这样的超大AI模型,Google也以多个TPU互连建立TPU Pod丛集,来打造超级电脑丛集,放在自己的资料中心内加速AI模型的训练。过去几年Google TPU Pod也从一开始256个TPU、增加到1,024个,到现在一个Pod拥有多达4,096个运算节点。以上图在Google资料中心使用的TPU Pod为例,分上下二层建立TPU Pod丛集,每层配置多台机架式机柜,每台机柜中安装了数十个TPU,包括TPU v2与 TPU v3,再透过网络线来与其他TPU高速互连。
但想要跟上深度学习发展脚步,Cliff Young认为,不能仅靠加大训练用的运算机器,现有的软硬件架构设计也得跟着转变才行,他提出materials -application codesign协同设计的概念,认为未来深度学习架构设计,需要结合包含从物理到应用所有层面的协同设计,他认为这是打破摩尔定律瓶颈,找到深度学习发展新出路的方法。
他进一步说明,在传统协同设计中,硬件和软件之间仅靠一层单薄的ISA指令集架构作为联系沟通,但在以DSA(Domain-specific Architecture)专用领域架构为主的协同设计中,则由包含许多不同软件层,架构层,以及不同界面组合而成。其中软件层方面,包括函式库 、编译器、应用程序、模型、算法、Numerics等,硬件架构方面包括物理设计、半导体材料、架构及微架构等。这些软硬件协同设计,未来可以运用到深度学习架构设计优化上,像是在内存技术中,能大幅降低模型训练过程对于位元(bits)覆写使用,以及加入采用较慢的内存读取速度的设计等。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步2024-06-28 09:27:13
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15