APP下载

CCAI 2019 | 张正友:机器人走向自主化 人机共生时代将来临

消息来源:baojiabao.com 作者: 发布时间:2024-11-30

报价宝综合消息CCAI 2019 | 张正友:机器人走向自主化 人机共生时代将来临

CCAI 2019

2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于在9月21日-22日在青岛胶州召开。

腾讯 AI Lab 及腾讯 Robotics X实验室主任张正友博士是大会程式委员会主席之一,是著名计算机视觉和多媒体技术专家,ACM和IEEE会士。

在立体视觉、三维重建、运动分析、影象配准、摄像机自标定等方面,张正友都有开创性贡献。他发明的平板摄像机标定法在无人驾驶、机器人以及视觉等领域,被全世界广泛采用,人们称之为“张氏方法”。

学术贡献之外,他在微软任职期间带领的研究团队在Windows、Office、Xbox、Kinect、Skype for Business等多款产品里都有贡献。

在人工智能发展引得举世瞩目的今天,执掌两大实验室的张正友,对人工智能与计算机领域有着怎样的思考呢?我们一起来了解。

今天是人工智能和机器人的初春

近年来人工智能在深度学习领域取得了令人振奋的进步:围棋智慧AlphaGo不费吹灰之力,便横扫人类两大顶尖棋手柯洁和李世石;在语音识别领域,人工智能的准确率也已经大幅高于人类;此外,人类识别技术帮助警方抓获逃犯的新闻不时见诸报道……

那么,人工智能的春天来了吗?

对此,张正友直言要“泼冷水”。在他看来,人工智能和机器人还有很长的路要走,现在仅仅是人工智能和机器人的初春,还会遭遇“寒流”。

他曾在公开场合举过三个例子,解释当前人工智能的局限。

第一个例子是2018年11月,宁波街头的闯红灯抓拍系统“逮到”了格力电器董事长董明珠,街头曝光台电子屏上出现了“董小姐”的头像!

可实际情况是,当时一辆车身上绘有董明珠广告的公交车刚好驶过,系统无法区分画像与真人,于是造成了“乌龙”。

第二个例子是语音翻译。张正友发现,无论是Google还是百度,都无法准确翻译出“前门到了,请从后门下车”这句话,哪怕他改成了“前门车站”也无济于事。

还有一个例子是索菲亚机器人,张正友说,“她”的对话都是通过预先设计好的场景来实现的,还远远达不到与人互动的水平。

因此,从事30多年人工智能研究的张正友表示,以眼下机器人发展的程度来看,自己并不担心“机器人消灭人类”这样的事情会发生。

不久的将来会是“人机共生”的时代

尽管提出了当前人工智能发展存在的一些局限,张正友还是认为,不久的将来我们就将迎来人与机器人共生的时代。

一方面,从最早的大型计算机,到个人电脑的普及,再到接下来互联网兴起以及智能手机的出现,计算装置经历了巨大的演变过程,可穿戴式或陪伴装置的未来也值得期待。伴随着这些演变,机器的计算能力从固定的时间、程式、地点逐渐向移动化、连续化、个人化转变,计算正在变得无处不在,人们可以随时随地获取想要的资讯。

另一方面是感知技术的升级。人们最早使用的还是打孔的卡片,后来慢慢出现了鼠标、键盘、摄像头、触控器等等,如今我们的智能手机上有了更多的感测器,现代装置已经变得越来越主动、个人化和多模态。张正友提出,如果把感测器从手里、口袋中解放出来,下一代机器人的雏形便随之浮现。那么人机共存、共创和共赢的时代必将来临。

在今年5月的腾讯全球数字生态大会上,腾讯也重申了对于基础研究的重视,立志攻克价值与挑战并存的两个核心大问题:第一是多模态研究,探索未来人机互动方式;第二是通用人工智能,打造一种通用、普适、终极的算法,最大程度释放技术原力。

过往大家主要是沿着感知、认知到决策不同方向发展。感知,如人脸和语音识别处理;认知,如实时翻译、智慧对话、阅读理解等;决策,如围棋AI、农业AI等,需要处理大资料并得出结论与建议。如果类比人类智慧,感知、认知和决策其实不可分割,是一个协同、平衡和制约的问题。当我们不再只对这三个方向做单一优化,而是进行跨学科、跨模态的交叉研究时,多模态研究就能让机器用感知判断人类情绪,用认知判断意图,并进行更复杂的分析与决策,从而不断向真正的人类智慧靠近。通过多模态研究,我们可以探索面向未来的人机互动方式。

机器人从自动化走向自主化

张正友执掌的腾讯Robotics X在大量调研后发现,目前全球机器人的本体研究上有六大方向与趋势:

第一,仿生化,比如蛇形机器人,让机器人能适应复杂的工作环境;

第二,灵活操控,只有实现灵活准确的抓取和操控,机器人才能做更有用、更复杂的运动;

第三,触觉技术,机器人需要实时反馈、精确的感知操控反馈,才能实现更有效的自主;

第四,多机器人协同,机器人之间要避免碰撞,高效协调它们之间的协作;

第五,人机互动,机器人与人要能达到非常自然的情感交流和安全的互动;

第六,医疗辅助,机器要能增强人的体能,帮助残障人士重获生活便利。

在张正友看来,这些趋势都指向一个共同的方向——更自主的机器人。以前人们讲的工业机器人更多是一个自动化的机器,它被预先设计好了之后就会执行重复运动;现在的机器人则开始慢慢往自主方向发展,自主的目的就是要机器人在有很大不定性的动态环境里,自主决策需要做的事情。

机器人技术突破点:A2G理论

机器人的发展要面向未来,需要在哪些方面取得突破?

张正友的回答是:A2G理论。

A2G即ABCDEFG,每个字母代表一个方面。

A代表AI,智慧。机器人必须要能看、能说、能听、能理解,才能与外界互动,完成它的目标。

B代表Body,本体。不同的本体决定了机器人的能力,比如蛇形机器人能穿过狭窄的通道,在一个复杂的环境中开展作业。

C是Control,控制。机器人要能自动控制,在没有人直接参与的情况下,可以根据外界情景变化对自身进行精准且不间歇地控制,并同时处理多项命令。

A、B、C代表了人工智能的基础能力。那我们该如何评价呢?张正友认为,要从力量、灵巧、快速、准确和优美的角度评估机器人。

接下来的D、E、F、G,是机器人需要具备的更高智慧或系统。

D代表Developmental,机器人需要发育学习。在张正友看来,这与当前火热的深度学习并不是一个概念。他指出,机器深度学习出来的能力依然是固定的,而人是通过与周围环境互动实现学习的,能力会越来越强大,如何让机器也具备这样的进化能力是需要研究的。

E代表EQ,即与人的情感互动。未来人和机器要共存,这就要求机器要对人也友情感上的理解,而且还要以适当的方式表达出来。

F是指FlexibleManipulation,灵活操控。未来我们需要的,不是电影里身披铁甲战衣的钢铁机器战士,而是对人类不构成伤害威胁的机器人,因此人造面板,或者能够实现灵活操控的高精度触感感测器就显得非常重要。

G是指Guardian Angel,守护天使。机器人的最终目的是要服务人、保护人,它不应该被视为独立的个体,而要与周围环境和感测器结合,还要和云结合,即使你的家庭成员或者朋友不在边上,你也能够很快跟他们取得感情交流。

结语

以“Make AI Everywhere”为愿景,腾讯 AI 在医疗、农业和公益等应用领域取得不错进展,也正在通过游戏、机器人和多模态等研究实验平台探索解决AI终极难题——通用人工智能——的道路。展望未来,我们将继续通过前沿研究提升AI的认知、决策和创造力,深耕行业,拥抱消费互联网与产业互联网,做好“数字化助手”标配,提供更好的技术、工具与服务,为人们的日常生活和社会发展带来更多美好便利。

2020-02-02 14:04:00

相关文章