腾讯AI Lab主任张正友：人工智能的热与酷

8月29日至31日，2019世界人工智能大会在上海举办，在31日举行的“科技有道择善而行”——腾讯论坛上，腾讯 AI Lab 及腾讯 Robotics X 实验室主任张正友博士进行了主题演讲。

以下为演讲全文：

各位领导、各位嘉宾、各位朋友，大家早上好！

很高兴再次来到世界人工智能大会。一年过去了，人工智能仍然是很热门的话题，it’s still a very hot topic。同时，人工智能还很酷，每个公司都想往人工智能上靠，投资公司投资的时候也要看看和人工智能有没有关系。“酷”这个字其实来自英文cool，非常棒的翻译。既是Hot也是Cool。但cool在英语里也有凉，有冷静的意思。所以我们同时要冷静看待人工智能。

近年来，世界主要发达国家都将人工智能作为国家战略，投入了大量的人力物力，力争赢得全球科技竞争的制高点。

作为在人工智能领域奋斗了三十多年的老兵，很高兴看到人工智能的今天。我也见证过人工智能的高高低低，深知最近人工智能繁荣的来之不易，是几代研究人员持之以恒，坐了几十年冷板凳换来的，我们都要珍惜，要把人工智能技术切实用好，造福人类。

同时我们也要认识到目前的人工智能离真正的智能还很远，比如智能如何发育和自主进化，这些都需要我们继续对人工智能的基础研究进行长期稳定的支持。

所以我们一定要两条腿走路。一条腿，支持将现有的人工智能技术赋能各行各业，造福人类。另一条腿，支持构建人工智能基础研究的稳定环境，推动人工智能基础理论的创新和突破。

人工智能主要有三大流派

符号主义(symbolism)，希望通过逻辑演绎系统，模拟人类智能活动。代表技术有启发式算法，专家系统，知识工程。

连接主义(connectionism)，模仿人脑结构，将神经元连成神经网络，利用连接机制来学习。代表技术包括感知机(perceptron)，支持向量机（SVM），深度学习（DNN）.

行为主义(actionism或situated AI), 通过外部行为探索智能，是一个感知-动作型控制系统。代表技术包括自组织映射（SOM），遗传算法，强化学习。

当然，这一波的人工智能兴起是以深度学习为代表的，得力于大数据和强算力，因而在视觉、语音、翻译等感知领域取得重大突破，跨越了很多应用门槛。

但是还有很多场景目前的深度学习还不能解决，比如认知智能包括机器的思考、决策、和推理能力，比如对环境的适应，比如学习能力的自主进化。这些都需要我们放开思维，大胆探索，将不同流派融合，甚至创造新的流派，开发出真正自主智能的系统。

下面我将围绕腾讯AI，对我们的布局，目前所取得的进展，以及未来的发展方向三个话题展开演讲。

目前腾讯已建立两大实验室矩阵——人工智能实验室矩阵，包括致力于全面基础研究与应用的在深圳及西雅图的腾讯AI Lab、基于视觉的腾讯优图、基于语音与自然语言理解的微信 AI等四大实验室；以及基于前沿科技的实验室矩阵，涵盖机器人、量子计算、5G、边缘计算、IoT和音视频技术等，打造面向未来的科技引擎，推动自主技术创新。

作为衡量机构研究实力的重要标准，成立两年多来，腾讯AI Lab的基础研究成果已覆盖CVPR、ACL、ICML、NIPS及Nature Communications等国际顶级AI学术会议或期刊，发表论文数量近350多篇，位居国内企业前列。此外，我们还发布了三大开源项目：

Tencent ML-images: 这是业内最大规模多标签图像数据集

PocketFlow: 这是世界上首款自动化深度学习模型压缩框架

中?词向量数据库：这是业内领先，包括了800多万中文词汇

腾讯积极与外部学界合作，建立了8大联合实验室，参与53个研究合作项目，联合培养34位顶尖学生，接待了17位全球访问学者。通过一年一度的学术论坛、联合研究、访问学者、博士生及研究生奖学金等多种项目和形式，推动前沿研究应用及人才培养。

下面介绍一下腾讯在AI方面的进展。

目前AI的现状主要还停留在感知层面，依赖大量的标注数据。在计算机视觉、语音处理、和自然语言里的自动翻译方面有很大的成功。比如腾讯的同声翻译就在支持着这一届的世界人工智能大会。

所以目前在限定条件下的感知与分析能力已经相对比较成熟。下一步要去解决充满不定性的现实环境的问题。我们的目标是取得技术突破，助力产业颠覆式升级。

AI的进一步发展依赖于提升三方面的能力：第一是内容的生成，第二是对世界的认知，第三是对行动的决策。下面我举几个例子。

在内容生成领域，我会举视频风格转换为例。在认知领域，我会举虚拟人为例。在决策领域，我会举绝艺围棋机器人为例。

这个工作依赖于对视频场景的深度理解，识别其中人物、物体、场景，并分析它们的关系，并在时间顺序识别视频中不同的动作和事件，就可以高效的生成丰富的内容，比如卡通风格的视频。

在认知领域，我们通过虚拟人的形态，进一步探索面向未来的人机交互新形式。它集合了计算机视觉、语音、自然语言理解到智能决策协作等多种AI技术于一身。通过跨学科、跨模态的交叉多模态研究，让机器用感知判断人类情绪，用认知判断意图，并进行更复杂的分析与决策，从而不断向真正的人类智慧靠近。

让我们看看腾讯虚拟人目前在游戏解说中的表现吧。请看视频。

我们相信这样的虚拟人具有无穷潜力，不但能虚拟解说，还能成为虚拟偶像、虚拟主持人、智能助手、儿童或老年陪伴、虚拟教师等等。

在AI决策领域，腾讯 AI Lab 一直走在行业前列。早在2016年研发的围棋 AI “绝艺”（Fine Art），三年了拿到了4次世界比赛冠军，现担任中国国家围棋队训练专用 AI。

策略协作型 AI 「绝悟」是2017年与王者荣耀共同启动的前沿研究项目。它的搜索空间比围棋要复杂的多，是10的两万次方。宇宙的原子数才只有10的80次方，可见王者荣耀AI的难度。去年，我们达到业余顶尖水平。今年8月初我们参加了在吉隆坡举办的王者荣耀世界冠军杯半决赛。在特设的5v5水平测试环节中，「绝悟」战胜了职业选手赛区联队，升级至王者荣耀电竞职业水平。测试结果代表腾讯在深度强化学习、多智能体决策智能课题上的国际级 AI 研究水准，也标志着公司在攻坚通用人工智能（ Artificial General Intelligence）难题上更进一步。

AI+农业，我们也迈出了一小步——一个很会“种”黄瓜的AI。去年在荷兰举办的国际AI温室种植大赛里，我们利用传感器和摄像头自动收集温室气候、作物发育情况等环境和作物数据，再用深度学习模型计算、判断和决策，驱动温室的设备元件，远程控制黄瓜生产，最后获总比分第二、AI策略第一的成绩，还开心收获了3496公斤黄瓜。

今年我们参与组织第二届AI+农业比赛，这次是种番茄，国内吸引了北大、中科大、农大、浙大及哈工大等名校参与。

AI+医疗，腾讯是“医疗影像国家人工智能开放创新平台”。腾讯专门成立团队深耕医疗领域，部分结果上线 100 余家三甲医院。

我着重讲一下我们智能显微镜的工作。我们在显微镜这种古老而重要的医疗器械中加入了AI与AR技术，让机器自动识别、检测、定量计算和生成报告，并将检测结果实时显示到医生所看目镜中，在不打断医生阅片的同时及时提醒，提高医生的诊断效率和准确度。

最后我想讲一讲腾讯AI的未来。

我们的愿景是通过深入研究，实现技术突破，迈向通用人工智能，连接人与人，人与内容，人与服务。

回到我演讲开始提到的，现在的人工智能真的智能吗？看看左边的视频，摄像头能一直跟踪住人，好像是智能的。但看看右边的视频，你觉得它智能吗？想象一下，如果一个人想要盖住你的眼睛，你会怎么做？我是会躲开的。但这个系统显然没有这样的举止。现在的人工智能只是机器学习：从大量的标注数据去学习一个映射。

那什么是真正的智能？我想目前还没有定论，我们对我们自己的智能还没有足够的了解。不过我很认同瑞士认知科学家Jean Piaget说的，智能是当你不知道如何做的时候你用的东西。

如何去实现有智能的系统呢？可能有很多条路，但我认为一条很重要的路是有载体的智能，也就是机器人。请看视频。

腾讯工业智能巡检操作机器人

在机器人领域，我提出了A2G理论，A是AI, 机器人必须能看能听能说， B是Body本体，不同的本体形态具备不同的能力，C是Control控制，让本体完成特定的任务。ABC组成了机器人的基础能力。D是Developmental Learning，发育学习，E是EQ，情感理解、拟人化，F是Flexible Manipulation，灵活操控。最后要达到G，是Guardian Angel，守护天使。因为时间关系，就不一一展开了。

我们在这届世界人工智能大会上展出了世界首款工业巡检操作机器人雏形，不知道大家去看过没有。本体Body包括移动平台，机械手，还有立体视觉。AI部分包括视觉读表，三维定位，有毒泄露气体检测等。控制部分包括机器人运动，机械臂操作，摄像头主动变焦，等。决策部分包括自主操控和遥操作。如果机器人觉得它自己完成不了，就会提醒远程操作员遥控。

我们还做了三款其它机器人：绝艺围棋机器人，桌上冰球机器人，还有机器狗Jamoca。

因为时间关系，我就不展开了。谢谢大家！

腾讯AI Lab是腾讯的企业级AI实验室，于2016年4月在深圳成立，目前共有70位世界顶尖的研究科学家及300多位经验丰富的应用工程师。借助腾讯丰富的应用场景、海量大数据、强大计算能力和一流科技人才等发展优势，AI Lab致力于不断提升AI的认知、决策与创造力，向“Make AI Everywhere”的愿景迈进。

腾讯AI Lab强调研究与应用并重发展，力争“学术有影响，工业有产出”。在基础研究上，AI Lab关注四大方向，包括机器学习、计算机视觉、语音识别及自然语言处理；技术应用上，实验室推进四大领域，包括社交AI、游戏AI、内容AI与医疗AI的发展。

实验室的AI技术也广泛应用在微信、QQ和腾讯觅影等上百款产品。行业应用上，实验室研发出的围棋AI“绝艺”屡获国际赛事冠军，是科技赋能国粹文化的代表。实验室支持的国家级AI+医疗标杆产品“腾讯觅影”也不断取得技术突破，从医疗影像延伸到辅助诊疗等功能。截止2019年5月，项目已落地100多家全国三甲医院，服务患者近160万人。

实验室还坚持与学界、企业界和行业共建“共享 AI+未来”，已和美国麻省理工大学、英国牛津大学、香港中文大学等多所海内外知名院校开展学术合作，

二、目前进展

关于AI目前所取得的进展，张老师提出当下的AI专注于认知与大数据，例如在计算机视觉、语音识别和自然语言处理中。通过与不同的垂类合作，结合工程和科学研究，AI在腾讯赋能内部业务职能推动了行业变革。

（2）AI+游戏

AI+游戏领域，腾讯 AI Lab 一直走在行业前列。与王者荣耀共同探索的前沿研究项目 - 策略协作型 AI 「绝悟」今年8月初在吉隆坡举办的王者荣耀最高规格电竞赛事——世界冠军杯半决赛的特设环节中，在职业选手赛区联队带来的5v5水平测试中获胜，升级至王者荣耀电竞职业水平。测试结果代表腾讯在深度强化学习、多智能体决策智能课题上的国际级 AI 研究水准，也标志着公司在攻坚通用人工智能（ Artificial General Intelligence）难题上更进一步。实验室早在2016年研发的围棋 AI “绝艺”（Fine Art），现担任中国国家围棋队训练专用 AI ；2017年，“绝悟”开始研发并在约一年后达到业余顶尖水平，腾讯还在清华联合团队在射击类顶级 AI 竞赛 VizDoom 夺冠，并在《星际争霸2》首先研发出击败内置 AI 的智能体。

AI+内容，通过推荐算法优化推荐用户喜爱的内容。在腾讯视频里，我们提供了超分辨率和视频分类的技术。此外，我们还探索了对视频内容的深度理解、编辑与生成。比如，让机器深度分析一个视频，识别其中人物、物体、场景，并分析它们的关系，并在时间顺序识别视频中不同的动作和事件，产生能表达出视频丰富语义信息的语句。

AI+社交，进一步探索面向未来的人机交互新形式，通过跨学科、跨模态的交叉多模态研究，让机器用感知判断人类情绪，用认知判断意图，并进行更复杂的分析与决策，从而不断向真正的人类智慧靠近。代号T.E.G的虚拟人就是腾讯多模态研究的代表，它集合了计算机视觉、语音、自然语言理解到智能决策协作等多种AI技术于一身，目标是不断逼近人类智慧。她穿梭于演唱会、体育或电竞比赛、教育课堂等不同场景，在虚拟助手、解说、老师到歌舞姬形态上具有无穷潜力。

AI+医疗领域，腾讯致力于打造筛查-诊断-治疗-康复全流程的医疗解决方案，并探索更多技术可能性，希望产品能真正在医院和医疗场景落地，切实帮助到医生和患者。我们在显微镜这种古老而重要的医疗器械中加入了AI与AR技术，让机器自动识别、检测、定量计算和生成报告，并将检测结果实时显示到医生所看目镜中，在不打断医生阅片的同时及时提醒，提高医生的诊断效率和准确度。今年我们还会继续通过“腾讯觅影”产品深入探索AI+医疗的应用，目前图像处理技术已用在食管癌、肺癌、糖尿病性视网膜病变等疾病的早期筛查上，语言和语音处理技术也用于智能导诊和辅诊上。

AI+农业，我们也迈出了一小步——一个很会“种”黄瓜的AI。在荷兰举办的国际AI温室种植大赛里，我们利用传感器和摄像头自动收集温室气候、作物发育情况等环境和作物数据，再用深度学习模型计算、判断和决策，驱动温室的设备元件，远程控制黄瓜生产，最后获总比分第二、AI策略第一的成绩，还开心收获了3496公斤黄瓜。

三、未来发展方向

腾讯目前将继续立足脚下，利用好人工智能（AI）、大数据（Big Data）和云计算（Cloud Computing），即ABC科技，构建新型基础设施，做“数字化助手”的标配，形成科技创新与产业应用相互促进的良性循环，这在医疗、安防、零售、交通与娱乐行业已经有所体现。

同时，腾讯也将放眼未来，在核心技术上推进前沿、原创和开放性的基础研究，并在关键性技术上前瞻性布局ABC 2.0技术版本，即人工智能（AI）、机器人（RoBotics）和量子计算（Quantum Computing）的全新ABC组合。

我们还成立了企业级机器人实验室腾讯 Robotics X ，构建AI+机器人双基础部门，打造虚拟世界到真实世界的载体与连接器。实验室的主要任务是攻克A到G的7大技术突破点：一是攻克“ABC”基础能力，即人工智能（AI）、机器人本体（Body）与自动控制（Control）；二是探索“DEFG”机器智能，包括进化学习（Developmental Learning）、情感理解与拟人（EQ）、灵活操控（Flexible Manipulation）等能力，最终实现成为人类守护天使（Guardian Angel）的终极目标。

我们做了一些展示型的Demo，分别是绝艺围棋机器人、桌上冰球机器人、机器狗Jamoca。