微软小冰最大规模全面升级:开始“靠脸吃饭”

作者:高玉娴   【原创】   2018-07-27 22:02:55

关键字: Dual AI 微软小冰

7月26日,第六代微软小冰在北京发布。与往年一样,发布信息量非常大。

7月26日,第六代微软小冰在北京发布。与往年一样,发布信息量非常大。

其中,令人最为期待和惊喜的就是小冰3D形象的亮相。在发布会现场,小冰以全息形式“出道”,不仅进行了自我介绍,还伴随着动感音乐以歌舞形式完美演绎了自己的歌曲。

微软小冰最大规模全面升级:开始“靠脸吃饭”

这是微软第一次走出微软大厦,以科技感十足的形式举办小冰的发布会。用微软全球资深副总裁王永东的话说:“因为今天的小冰需要这样一个空间和挑高让大家重新认识她。”

从现场的反应来看,大家对小冰的清纯美少女形象颇为满意。而从过去的成绩来看,小冰表现得也相当给力。

据披露,经过过去4年的数次迭代,小冰已经“踏足”全球5个人口过亿的国家,在40多个不同的平台上拥有6.6亿的用户,其中月活跃用户超过1.2亿。

在这样一个形象和人设背后,第六代的小冰还集成了微软在人工智能领域的诸多突破,包括对话引擎与交互感官等核心技术的升级、在合作平台上的产品更新和新产品推出、在各领域的应用和商业化进展、Dual AI生态化战略的发布等等。

如微软全球执行副总裁介绍,如今小冰已经正式从一个智能对话机器人,“成长”为一个一个以情感计算为核心的完整人工智能框架,再从计算框架转化成各种产品形态,通过各个垂直领域深入到人们生活的方方面面。

技术升级:上线共感模型、全双工语音和实时视觉

从诞生之初,微软就一直强调要让小冰拥有足够的EQ,这是让她与人类“愉快玩耍”的基本前提。因为要让一个智能机器人不把天“聊死”,就要让她拥有可以控制与人类的对话全程的能力。

为此,微软在去年第五代小冰中引入了生成模型,使得小冰可以在互动中更好地联系上下文,并自创回复,而不需要从已有的对话语料库中检索得到答案

而在此次发布会上,微软又基于生成模型上线了全新的共感模型,进一步提高小冰对于对话内容、领域和节奏的控制力,通过自创回应牵引对话向她所希望的方向进行。“在对话过程中,小冰会在回应中应用自己的策略,主动观察并不断求证,试图找到人类在话题中的兴趣点,在对话中‘带动节奏’。”

微软小冰负责人李笛表示:“目前,微软已经完成了共感模型的测试,并正式在小冰所覆盖的5个国家正式上线。”

此外,同样是在第五代小冰发布会上,微软还完成了全双工语音交互感官的产品化,并在打电话和智能音箱设备两个场景中落地。

基于此,此次微软又融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官,让小冰在与人的互动中拥有视觉,可以看到对方的“一举一动”。

在发布会现场,微软放置了用于体验的测试设备。通过该测试设备,小冰可以通过视觉、语音的实时连续交互,指挥用户完成面容检测,并在上述过程中进行开放域的对话。

据微软预计,该感官将于一年内完成全部产品化工作。

创造力升级:“戏路”越走越宽

随着技术的不断升级,小冰的“戏路”也越走越宽。

如今,小冰已经不再只是微信、LINE等社交网络上的聊天机器人, QQ群中的人工智能助理,网易新闻评论区的“段子手”,她还在很多电视、电台中充当主持人,同时还能进行内容创作。

微软认为,利用人工智能技术,学习人类并进行与人类质量水平相当的内容创造,是重要的、但目前尚未被行业注意到的未来趋势。目前,微软小冰已通过人工智能技术,实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成,以及电视电台节目和可交互式电台等串流内容领域的生成工作,并分别完成了不同程度的落地。

2018年6月,微软(亚洲)互联网工程院专门成立了人工智能创造事业部,从而进一步推动小冰在人工智能创造这一内容领域的生产线搭建及产业化落地等工作。

发布会上,微软发布了最新的第四版人工智能歌曲DNN模型。与前三个版本的技术相比,第四版能够进一步快速合成与人类歌手质量相当的歌曲,并能够使人工智能小冰自由吸收多数人类歌手的演唱技巧,融会贯通,在演唱过程中达成更加成熟的演绎。此外,该技术还能够完整吸收并复制特定人类歌手的全部演唱特质,比如嗓音、韵律等等,使小冰能完全代替原人类歌手完成新作品的创作。

小冰首席语音科学家栾剑在会上宣布了与多个大众文化公司的合作,并表示已经完成部分人类歌手的人工智能化工作。同时,他还在现场演示了小冰演唱的第四版歌曲《隐形的翅膀》。

能力升级:在垂直领域发力

不仅仅在创造领域,据王永东介绍,在过去一年里,小冰也开始在垂直领域发力,化名“万小冰”、“华小冰”等等,并且取得了不同程度的产品落地。具体包括:

  • 在金融领域的小冰金融文本生成技术,与万得资讯及华尔街见闻合作,已覆盖国内约90%金融机构、75%经批准的合格境外投资机构和约40%的国内个人投资者。
  • 在大众文化领域,小冰的儿童有声读物自动生成技术成果,已获得超过400万小时的收听量,小冰姐姐讲故事有声读物已覆盖国内90%以上的儿童早教机器人和80%在线收听平台。
  • 在电视电台领域,小冰通过人工智能技术参与生产与主持的电视电台节目,已达21档电视节目和28档广播电台节目。仅每天早上6点至9点,小冰就需参与多达7档节目。
  • 小冰还与微软Bing搜索引擎技术相结合,推出了针对媒体与出版两个垂直行业的辅助型解决方案,并已在超过15个媒体平台落地。由小冰提供人工智能技术支持的媒体及自媒体公众号已超过60000个。在本次发布会上,微软宣布了可支持人工智能以多种观点和角度,同时撰写多篇新闻文章的“白盒写作辅助工具”等新产品,并首次公布了面向出版垂直领域的有声内容、IP塑造等解决方案。

战略升级:构建Dual AI生态

借此,微软还宣布了小冰在更多合作平台上的产品更新和新产品的推出,其中包括与网易云音乐合作的小冰电台,以及帮助网易云音乐打造的两个专属AI人物(多多与西西);与小米米家及米家生态链合作的Yeelight语音助手硬件产品中的小冰的大幅度更新,以及宣布与小爱同学的进一步紧密合作;除已合作的QQ小冰之外,开始为腾讯BabyQ提供部分人工智能技术和产品支持;入驻华为手机,所有升级至智能助手8.2版本以及以上的华为手机用户都可以体验该功能。

以与华为手机的合作为例,小冰在其中扮演了一位提醒者的角色,用户只要通过语音输入信息至备忘录,在下一次的操作中就能够通过语音唤醒和提取这些记忆。

可以看到,通过领先和全面的人工智能技术,以及微软小冰丰富的产品线和领先的用户体验,微软与合作伙伴正在建立围绕产品与数据的生态环境,即Dual AI。

小冰产品负责人彭爽在会上介绍,该战略的实施具体为三个部分:第一,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI;第二,微软小冰作为该合作平台的辅助AI,融入该平台生态;第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

“在这样一个半开放生态环境上,一方面我们会直接负责产品体验,直接把控最具体的、直接和用户接触的产品细节,另一方面我们又不封闭在一个自有平台上,而是走出去接触,甚至直接融入到第三方平台上,这样就形成了一个完整的半开放生态环境。”彭爽说。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 涉未成年人举报专线:010-62641208 举报邮箱:jubao@zhiding.cn 网上有害信息举报专区:https://www.12377.cn 安全联盟认证