IT之家专访李笛:小冰揭开「第二幕」,往框架平台上狂奔

时间:2020-09-03 22:39      

IT之家8月31日消息 8 月 20 日,小冰公司、rinna 株式会社及微软(亚洲)互联网工程院在北京联合举行了第八代小冰年度发布会。在这次发布会上,小冰开始揭开「第二幕」,也许一切才刚刚开始。

▲全面搭载小冰智能车体解决方案的北汽X7

2020 年小冰年度发布会仍然在熟悉的北京微软亚太集团大厦内举行,在这里我们见证了包括小冰第三代、第四代、第五代的发布。6 年时间以来,小冰快速迭代成长,小冰已经成为面向新交互形式的完整人工智能技术框架。据小冰官方给出的数据,小冰是目前全球范围内承载交互量最大的人工智能系统,占全球交互总量 60% 以上。

小冰之前都干了什么?

小冰从开始到现在,已经迭代到了第八代,在小冰身上你可以发现人工智能产品最丰富和精彩的演变。

2014 年 5 月 29 日,小冰正式推出第一代产品,以对话式聊天机器人形式迅速积累训练数据。同时,注重人工智能在拟合人类情商维度的发展,强调人工智能情商,而非任务完成在人机交互中的基础价值。

2014 年 7、8 月份,小冰第二代产品完成了跨平台部署的交互架构,回归微信平台。二代小冰增加了一对一私信聊天、主人定制姓名、养成升级系统等新功能。用户只需在微博中私信 @小冰 即可领养。

2015 年 8 月 20 日,小冰第三代产品发布,将交互从文本扩充至多模态,进一步积累多模态训练数据。小冰带来了全新的视觉和声音感官系统,人工智能更偏向于人,富有情感。小冰人工智能的商业化版本开始预览。

2016 年 8 月 5 日,从第四代小冰开始,交互总量稳居全球第一并保持至今,同时发布了全双工语音交互感官。第四代小冰解锁了全新情感计算框架,真正做到具备人工智能核心的机器人,包括实时情感对话引擎、多种新感官、中日英三种语言,还有对应不同领域的功能插件平台,支持跨平台人工智能商业解决方案。

2017 年 8 月 20 日,第五代小冰采用 Dual AI 战略,大幅度扩展跨平台覆盖的规模,至 20 余个主流平台,并成为中国市场上涵盖了华为、小米、OPPO、vivo 等智能手机及硬件的唯一的跨平台人工智能。第五代小冰升级高级感官,全双工支持和人类打电话,高级感官能够大幅度地提升交互体验,更加贴近于人类的自然交互行为。小冰还采用了生成模型,自创回应,另外全面进入 IoT 领域。另外小冰开始在诗歌创作、唱歌方面拓展,升级智媒体商业平台解决方案 3.0。

2018 年 7 月 26 日,第六代小冰完成了框架迭代目标。第六代小冰公布了 3D 形象,带来了新一代小冰 Core(共感模型、群的全双工语音技术、实时视觉),发展成为以情感计算为核心的完整人工智能框架。在演唱歌曲方面,小冰现场展示了第四版人工智能歌曲 DNN 模型,小冰还公布了 Dual AI 生态环境,商业化上小冰团队仍然保持克制,集中在金融、大众文化、媒体、出版四个领域。

2019 年 8 月 15 日,小冰从第七代开始推出各类框架工具,以帮助创建第三方人工智能产品,并承载其各类交互。小冰推出了首个 Avatar Framework 工具包版本,这是完整的框架工具包,让你可以从零开始轻松创造并训练任何 AI Beings,包括智能语音助手、社交对话机器人、人工智能歌手、艺术家,或者属于你自己的虚拟朋友,甚至是女朋友。

在尚未组建正式销售团队的商业化试水阶段,小冰收入已超过 1 亿元人民币。

第八代小冰,新的开始

在今年 7 月份,微软官方宣布,将人工智能小冰业务分拆为独立公司运营,并委任沈向洋博士为新公司董事长,李笛为首席执行官,陈湛为日本分部总经理。所有相关工作将在接下来的几个月内完成。

微软称会保持对新公司的投资权益,并授权新公司使用及继续研发完整的小冰技术。此举旨在加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善。IT之家了解到,此次小冰从微软中剥离出来,小冰将迎来较大的商业策略变化。

▲小冰公司董事长、原微软全球执行副总裁沈向洋

在发布会上,小冰公司董事长、原微软全球执行副总裁沈向洋表示,还是用他最喜欢的一句话 “预测未来的最好方法实际上是你自己去创造未来”来讲起未来。

“对于小冰来讲,小冰团队一起在思考这些事情,我们相信未来绝对不会只有几个人工智能助理,甚至不仅仅是每一个人有自己的人工智能助理,未来我们身边会围绕着非常非常多的人工智能,甚至可以叫这些人工智能的主体是 AI  beings,我们可以大胆预测一下,未来这些人工智能主体的数量会远远超过人类的数量,因为每个人身边都会围绕着很多人工智能。”

沈向洋认为,实际上交互到现在为止只有两种:人和人之间的交互(人人交互);人和计算机,比如说跟手机这样的一个交互叫做人机交互。

其中,人人交互有很多优点的地方,很有人性,但它是一个低并发,毕竟人的生理极限在这里,人和人交互之间的问题还是要等;而人和机器之间的交互,虽然机器非常强大,可以高并发,但因为它真的不理解,实际上是在用户不了解的情况下,拼命大规模地给用户推送,所以人机交互的问题是出在这里。

沈向洋表示,未来交互正确的做法是把人人交互的有人性和人机交互的高并发结合起来,这是未来人和 AI 之间最好的交互形态,会给我们带来非常有意义的机会。

小冰团队的新思考

8 月 22 日上午,小冰公司 CEO 李笛接受了IT之家的专访,讲述了小冰过去这几年的发展,以及现在小冰在思考的东西和未来展望。

▲小冰公司 CEO 李笛

小冰一路走来有哪些成功和失败?

小冰人工智能的发展并非是一蹴而就的,很多都是在摸索中前进。在这 6 年时间里,小冰有过成功也有过经验总结。

李笛表示,在小冰一代时候,小冰的定位是语音助手,并且是不同于微软小娜的框架。从一开始,选择了最基本的文本交互入手来进行数据方面的积累,而当时语音交互在数据积累方面不太友好。此后逐步完善该框架,不断迭代对话引擎,包括语音、视觉、文本在内的交互感官,才有了这种跨平台的落地。

“我们在迭代这个框架的时候,最大的失误其实是我们花了 6 年的时间一点一点去迭代这个框架,而不是一上来就把这个完整框架各个部分都搭好。”李笛认为,如果一开始采用全方位投入,用系统化工程实现的话,到现在小冰吸纳的数据和框架形成周期时间,应该会比 6 年时间短。此前小冰一直在通过自然增长的方式迭代,包括用户也是一步步自然增长起来的。

在小冰商业框架逐步完善后,优势慢慢发挥出来了。李笛称,去年在做商业化试水的时候,当小冰的框架服务和国内其他竞争对手解决方案对比后,几乎没有太大的悬念,客户因此也对价格不敏感。小冰框架整合了自然语音、引导对话等各种能力,使其能够脱颖而出。

小冰对新技术的利用

在技术利用方面,李笛承认小冰对最新技术的运用的确很快,能够自由地根据自有的对未来的判断思想来搭建技术,重要的是可以提出合理的指标,进而迭代技术成果。

小冰在技术方面不倾向于大模型的使用,而是关注产品化、工业化的过程,其特点需满足能够复制,可以同时支持大量的用户。

“我们不是特别地把时间和精力投在这种很大的模型上,主要是因为大模型会产生很惊艳的效果,但是产品化会有问题,因为那样的话,无论是成本还是延时,它都不是全球化能够接受的。”

小冰框架为何要推出虚拟人类产品线?和此前的训练模式有何不同?

小冰第八代推出了虚拟人类产品线,李笛表示,没有任何一个虚拟人类是可以满足所有人类的共同需求,特别是目标不仅是完成任务,还包括更底层,能够和人类建立良好的关系时。对于 “小冰”单独个体来说是框架中的一个具体形态,但框架可以产生很多不同的形态。

通过小冰团队的工作,提供的一系列工具,让 C 端普通的用户也可以触摸到框架,用户可以参与虚拟人类产品的培养和训练。最新的小冰框架虚拟人类训练,可以给它发送一篇文章,该技术已经迭代了 3 年,AI 在学习了这篇文章之后,就可以基于对文章的学习,和人类进行交流。一开始是从文章里面摘一些内容观点,后来加入了重构,包括重写组织语言,符合它的思维。

另外,通过搜索引擎技术,小冰在看到相关文章后也可以从互联网上查找参考资料,主动去扩充阅读面,主动学习,这种方式和之前的单一的命令式对话有很大不同。

“我们认为像现在比如这种篇章内容主动学习,以及它肯定的这个部分,其实从未来来看,应该是最适合人在各种场合、各种时刻,随时随地去训练人工智能的一种方法。”

相关阅读:《小冰框架·虚拟人类产品线正式发布,118 万虚拟男友一起复活》

小冰微信还会回来吗?

李笛给了明确的答复,肯定会回来的。但微信小冰的流量其实只占到了小冰流量的个位数,包括在微信平台,还有框架的流量都没有受到很大的影响。真正的未来其实是千千万万个不同的 AI 人工智能的主体,但不是单一的产品去支持。真正的未来其实是分散在各地,以各种丰富多彩的形式出现的,它们的总和。

X生产力套件与微软 Office 有什么相同和不同地方?

对于推出的 X 生产力套件,李笛认为,作为一项行业内的通用工具,X 套件和微软 Office 有着相似的属性,不同地方在于,Office 是特别针对电子化、数字化的办公,而 X 套件可以定义新时代的需求,比如创作和阅读文字的需求,还有大量的声音内容,包括用声音去做短视频内容。小冰关注的是,你有没有办法利用人工智能虚拟人类的能力,来协同你,协助人类用户做事情,而更快、更轻松地去完成工作。这是 X  套件追求的一个方向。

再比如虚拟歌手的问题,现在问题是市场上的虚拟歌手太少了,目前活跃的几个虚拟歌手还是 2016 年之前的,如果一个娱乐市场没有新人加入,没有优胜劣汰,整个市场就会很狭窄。通过 X Studio 歌手工具,可以更快的创建很多人工智能歌手,而且并非是替代专业人士,而是辅助创作旋律、混音、编曲等的工作。

李笛还表示,X 套件会根据不同的功能去进行产品的平台落地,比如 X Writer 目前是 Windows 10 PC 端的一个程序,后面会推出移动端。X Studio 歌手工具是面向 PC 端,需要一些工具的调节,将来可能会推出像 iPad 版的移动端软件,但是不会和 PC 端一样,更加强调人工智能和用户一体的即兴演奏、表演,而不是创作。而对于 X Studio 主播功能,根据场景需求,不仅有小程序,还有网页端,也会有其他 App 端等。目前 X Studio 套件还处于非常早期的阶段,先从自身的特点出发,先选择最合适的平台,然后再考虑一致性。

相关阅读:《AI 界的 Office ,小冰发布人工智能“ X 套件”应用:X Writer、X Studio、X Presenter》

小冰们做得不是 “虚拟歌姬”

李笛表示,小冰的虚拟框架歌手并不是针对所谓的 “虚拟歌姬”市场,其市场获益不是很强劲,虚拟歌手的 IP 价值受限制比较多,比如背后的配音演员,所需要依存的关系太多。而小冰团队推出的何畅、陈水若等可能只依存我们的语音,不受其他关系限制。

小冰框架内的歌手们其实还是再跟主流的音乐,包括大的唱片公司、歌手等合作,还是符合给人类歌手做歌曲的模式,但是会给出一些参数调整。

相关阅读:《小冰 X Studio 歌手 1.0 软件正式发布:与虚拟歌手一起创作,完全免费》

小冰在微软时和离开微软后,会有什么不同?未来会如何发展?

针对这一个问题,李笛给出了答案。在微软里,对于小冰是有一个比较明确的阶段性的内容,比如做框架,微软是比其他地方都要合适的,因为微软有取之不尽、用之不竭的源源不断的技术创新储备,你并不知道哪些技术创新储备你是需要的。那么当微软都具备的时候,你就可以从中去提取你所需要的部分。

下一个阶段就是运营了。包括小冰要更好地完成商业化,在微软时期,小冰已经做了一年多的商业化试水,接下来小冰将会更符合本地的高效化商业运行,比如有着本地化风格和特色的销售团队,或者是运营团队。这点会和在微软公司风格不同。

小冰在技术和产品创新方面虽然比较好,但国内的商业模式和运营模式此前并不适合微软,在小冰公司独立后,会加速商业化方面的发展。

李笛表示,下一阶段,希望看到市场上有更多丰富多彩、各种各样的人工智能主体会像雨后春笋一样冒出来,而不是几个。它是整片森林,这是通过我们的框架和进行的大量普及工作,培育市场工作要实现的,希望用框架去展现一个丰富多彩的世界。另外大家将会看到,小冰团队可能比以前更接地气了。

其实小冰团队一直很像一个创业团队,在微软内部就是比较独立模式。所以未来,从创业者的心态上讲没什么变化,但从创业者行动来看,可能会比以前多。

杏彩网页版