在2021年开发者大会上,Line揭露了一款超大语言模型HyperCLOVA,宣布要以这个模型,发展一系列企业级的自然语言处理(NLP)服务,包括用来快速打造NLP应用程序的Studio,以及用来处理NLP训练资料的Explorer,甚至还有一套AI Filter来过滤模型输入和输出值,替企业把关产出品质。
拥有820亿参数,语音助理、开放式对话、标语生成都能做
这不是HyperCLOVA首次亮相。早在今年5月,Line母公司Naver就在自家AI大会上揭露HyperCLOVA,号称韩文版GPT-3,用2,040亿个参数训练而成,比GPT-3的1,750亿参数还要多。几个月后的现在,经过Naver和Line共同改良,HyperCLOVA再次现身重量级大会,不同的是,Line揭露的HyperCLOVA懂的语言更多,还更有完整的产品生态系蓝图,以及更多的实用案例。
比如,大会现场,Line AI首席执行官砂金信一郎就亲自示范以HyperCLOVA优化的虚拟YouTuber绊爱,来与真人即时问答互动,就连能自动打电话订位的虚拟助理AiCall,也由HyperCLOVA驱动。甚至,Line NLP团队经理Toshinori Sato秀出一段自己与HyperCLOVA聊天机器人的对话,对话角色包括他自己和拟人化的商品色铅笔,当他询问色铅笔“你是什么颜色”时,色铅笔回答“我是红色”,当他问“你喜欢什么颜色”时,它说“蓝色,因为蓝天和海洋很美丽,不是吗?”这个简单的示范,点出了HyperCLOVA作为商品聊天机器人的应用潜力,企业可用来开发专属机器人,回复顾客对商品的各种问题。
这款HyperCLOVA具有820亿个参数,是大型多语言模型,正处于整体发展蓝图的第三阶段。这代表,HyperCLOVA已走过只精通日文、规模达130亿参数的第一阶段,也经过390亿参数的多语言模型第二阶段。而且,HyperCLOVA在第二阶段,就与BERT大型日文模型表现相当,准确度只差1.65(85.03对86.68)。明年,HyperCLOVA还要从第三阶段迈入最后阶段,不只要达到2,040亿参数规模,还要成为超大规模(Hyper-scale)模型。
自建语料库3原则透露商品化野心,用小样本学习保有通用力
要训练如此庞大的HyperCLOVA,得先建立一套语料库。Toshinori Sato点出,Line收集语料有3个原则,第一是不从Line任何对话服务中取得资料(包括Line社群功能OpenChat),再来是确保语料多样性,最后是建立语料库子集,如此才能将语料库用于Line以外的服务。这3个原则,也凸显Line要以HyperCLOVA发展AI产品的决心。
在这些原则下,他们以NLP经典开源预训练模型BERT的2019年资料集为语料库基础,再以爬虫方式收集Line搜寻的文字资料,同时购买外部资料,并确保这些资料来自重要的网站,让模型学习各种日文表达方式。Toshinori Sato强调,Line团队特别注重个资,语料库中任何与个资相关的讯息,都会删除。
经过一年多努力,这个语料库目前累积到1.8TB大,拥有100亿个样本,Token数量达到5,000亿个。虽然Line未透露太多HyperCLOVA的模型架构细节,但可以看出,有别于直接拿BERT来微调下游任务的NLP圈常见作法,Line重新打造一套属于自己的大型预训练模型。Toshinori Sato表示,BERT虽然只需依使用者需求,用特定任务资料集来简单微调下游任务(如翻译、问答),就能享有SOTA模型准确度,但,使用者还是得按不同任务,建立专属小型资料集来微调BERT,这种监督式学习方法,可能让BERT丧失通用能力。
为保有通用力,设计HyperCLOVA时,Line就决定要让它可透过小样本来学习(Few-shot learning),甚至是单样本(One-shot)和零样本(Zero-shot)。意思是,在小样本的情境中,开发者只需给定一个任务描述和少数示例,HyperCLOVA就能以这些样本来学习解题。在单样本学习中,开发者给定任务描述和一个示例,模型即可学习,甚至在零样本中,只需提供任务描述即可,不需任何示例。这么做,HyperCLOVA可根据简短的描述或少量样本来解决各种任务,更贴近一般企业的需求。
这就是Line的HyperCLOVA计划。他们希望,靠HyperCLOVA一个大型模型,就能利用多种资料,来解决多种任务,扭转过去“一种资料来源-一个模型-一个任务”的窘境。Toshinori Sato举例,过去,要解决搜寻任务,只能用搜寻模型来分析网页资料,产出所需的搜寻结果。或是,要用购买纪录进行商品推荐和顾客关系维护时,得分别打造两套模型,一套用来推荐,另一套用来维持顾客关系,即便两者的资料来源都是一样的,还是得用两套模型分析。
“我们希望用一个大型模型来处理各类资料、执行各种任务,”他举例,这个超大模型要能分析网页资料、购买记录、交易纪录、语音输入,并用这些资料来执行搜寻、问答、商品推荐、需求预测、对话等任务,至少先解决这些任务共通的NLP问题。这个方向,定下了HyperCLOVA的发展基调。
当引擎驱动两大应用系统,还要打造企业通用AI生态系
图片来源_Line
大会上一张HyperCLOVA的发展架构图,清楚点出未来产品路线。在这张架构图的最底层,是驱动一切服务的资料层,包括各类大数据和开放资料。在资料层之上是模型层,也是HyperCLOVA模型所在处。这层包括了两类重要模型,分别是通用的超大规模模型,以及专精各类任务的小型模型,包括日文模型、多语言模型、影像模型等。
模型层之上是基础架构层,包含模型训练与推论,再往上就是HyperCLOVA所驱动的前端应用系统,包括Explorer和Studio。其中,Explorer专门用来处理AI训练资料,比如文字资料生成、文字资料分类,让使用者用来打造AI模型。特别的是,Explorer中还搭配一套AI Filter控管机制,来把关模型的输入值与输出值,同时确保HyperCLOVA不被滥用。Studio则是更应用导向的NLP开发工具,它有三大功能,包括用来开发NLP应用的沙盒环境Playground,以及资料生成和强化功能,还有NLP模型微调功能。这些功能都以HyperCLOVA驱动,目前最成熟的功能就属Playground。
Playground可以怎么用呢?Toshinori Sato在会场上,展示一款以Playground打造的广告文宣生成应用程序。在这款应用程序中,使用者可输入自家产品名称、一句摘要(如产品成分、产地)和说明,系统就会产生一段产品文宣,使用者可调整温度(Temperator)、重复排除(Repeatition Penalty)和最大词汇量(Maximum Tokens)等参数,来调整文宣内容。
HyperCLOVA Studio中的Playground有如沙盒环境,使用者可用来开发各类NLP应用,比如打造一个快速生成产品广告文宣的应用程序,只要输入产品名称和简短摘要,就能产出文宣内容,使用者还可调整参数来变更内容。图片来源_Line
这个只需输入单项产品资料、就能产出文宣的功能,就是运用HyperCLOVA单样本学习的能力。但这只是Playground的范例之一,企业可用Playground来开发多种NLP应用。今年,Line也将开放开发者试用Studio,并释出Python SDK,要让大家都能使用。
不过,在Line的技术战略中,NLP应用只是第一步。Line预告,接下来要结合电脑视觉技术,赋予HyperCLOVA“看”的能力,既要能看懂影像,也要懂影像中的文字,比如将多模态AI纳入主打的OCR服务,让AI辨识图片中文字,还能理解文字含义,甚至,Line要进一步将推动工作流程自动化,利用影像辨识和NLP能力,来自动化法律合约检视与修改。他们的目标是,用一个模型解决多模态任务,打造MiLAI(Mixed Line),往通用AI迈进、打造更完整的AI产品生态系。
相关文章
- YouTube更新违反规定政策,提升惩处透明度和一致性
2023-12-31 14:00:52
- 传苹果将把中国iCloud正式交给本地化经营 苹果手机icloud换区存储操作
2023-12-27 18:34:43
- 刘德华代言什么手机?刘德华成华为Mate 60 RS非凡大师华为5G新手机代言人
2023-09-26 21:55:08
- WebOS新系统:Palm Pre手机最新款高价登港
2023-06-23 15:39:14
- 帮助企业组织对抗勒索软件,资安通报机构设立防护专区,可协助事前、事中与事后因应
2023-06-22 09:36:10
- 蔚来全系产品降价3万 取消免费换电 换一次电池180元
2023-06-12 17:27:49
- 电商平台三巨头开打最大规模折扣 价格战再次打响
2023-03-05 18:58:40
- 爱立信节省成本裁员四千人 爱立信全球员工总数五分之一
2023-02-24 22:27:29
- 蜜芽关停近况,八位数重金买三字顶级新域名mia.com也关闭
2023-02-23 16:18:14
- 联想CEO杨元庆:联想集团需要裁员32%削减部分业务支出
2023-02-18 12:45:25
- 蓝色光标2022营收亏损18亿 客户预算减少明显
2023-02-18 12:40:08
- 三星工厂或将80%生产转至越南 因本地劳动力成本上升
2023-02-17 23:09:16
- 香港八达通卡如何激活?没用失效过期余额怎么办
2023-02-17 18:34:51
- 中兴通讯被曝将裁员20% 称只裁国外的
2023-02-17 18:33:26
- 苹果新iPhone15Pro手机终于改用USB-C(火牛)数据线??Lightning充电接口退出
2023-02-17 16:57:22
- 突发!蓝色光标曾为中国民企500强龙头 如今业绩亏损断崖下跌
2023-02-16 14:31:19
- 三星发布自家carplay车载中控系统 Car Mode for Galaxy 可以连接carplay吗?
2023-02-14 00:53:17
- Opera浏览器宣布集成ChatGPT 一键生成网页内容摘要
2023-02-14 00:32:08
- 谷歌google计划重返进入中国市场?但结果可能令你失望
2023-02-13 16:57:15
- Zoom紧急裁员1300人 佔员工总数15%
2023-02-08 14:59:11
最新资讯
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步2024-06-28 09:27:13
手机
- 中国11月手机出货量增34% 5G手机出货量2709.2万部2023-12-28 19:27:57
- 荣耀发布新一代旗舰荣耀Magic5系列,新款上市价格分期0首付3999元起2023-03-06 16:12:32
- 美国商务部指违禁,长江存储被美国拜登制裁名单面临停工裁员2023-02-17 18:41:53
- 苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌2023-02-02 17:33:27
- 香港去哪买三星手机回来吗? 买香港便宜售价手机市场地点和网站2023-02-02 11:03:11
数码
- 华为5G芯片正式亮相:预示华为将发首款5G手机2023-08-31 13:22:33
- 腾讯传计划放弃虚拟现实VR硬件计划2023-02-17 23:32:30
- 三星手机份额大跌!三星手机中国市场份额变化国内仅剩3%2023-02-01 17:06:15
- 三星手机份额大跌在中国没市场了!国内市场占有率仅剩1%国外比苹果销量高2023-02-01 16:59:53
- vivo发布2022 vivoNEX手机极简易浏览器下载:简洁流畅无广告!2022-12-02 17:29:30
科技
- B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了?技术团队公开早先原因2023-03-06 19:05:55
- 苹果iPhoneXS/XR手机电池容量续航最强?答案揭晓2023-02-19 15:09:54
- 华为荣耀两款机型起内讧:荣耀Play官方价格同价同配该如何选?2023-02-17 23:21:27
- google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格:刘海屏设计顶配版曾卖6900元2023-02-17 18:58:09
- 科大讯飞同传同声翻译软件造假 浮夸不能只罚酒三杯2023-02-17 18:46:15