数字营销公司Stone Temple通过一份包含4942个查询的详尽列表,测试了Alexa、Cortana、Google Assistant和Siri。对于每一项,受访者可以勾选该智能助理是否回答了问题、是否理解了问题、回答是否错误、答案是否来自数据库或第三方来源,如维基百科。
结果明确显示:微软Cortana比大多数人预想的要聪明得多。
Cortana在Google Home上的表现甚至超过Google,但令人惊讶的是,Google Assistant在移动端却表现的不是那么聪明。Cortana大幅超过Alexa,苹果的Siri甚至还差得远。
在移动端,Google Assistant几乎可以尝试回答80%的问题,在准确性和完整性方面的得分超过90%。Cortana尝试回答的问题相对少一些——约65%, 但成功率超过90%。
然而,Alexa却只命中了一半的问题。
Siri尝试回答超过40%的问题。
对于这些智能助理尝试回答的问题中,Alexa和Siri表现不错,准确率达到了80%左右。但显然,这是从一个较小的知识库中进行操作的。而作为两大领导者,谷歌和微软在过去十年中运行着庞大搜索引擎绝非偶然。
过去几年,有数十亿人在提出问题,这一点并不令人感到惊讶,他们通过点击来选择哪些答案是最佳答案,这让微软和谷歌变得更加聪明。
对亚马逊来说,另一个亮点是:Alexa正在快速增长。
在去年Stone Temple进行的研究中,Alexa仅仅尝试回答了20%的问题。今年,Alexa尝试回答的问题超过一半,有进步了。
苹果Siri也变得越来越聪明,但速度并不快。去年的测试中,Siri尝试回答31.4%的问题,今年提高到了40.7%。
对于企业来说,人工智能是一个越来越重要的竞争优势,尤其是那些正在打造语音优先的个人助理的大型科技公司。苹果正在这方面努力进行改善,并且最近挖来了谷歌搜索和人工智能的负责人。
好消息是:人工智能助理通常不会提出误导性的询问(不过最近在被问及飞机化学痕迹时,Alexa曾一度抛出了政府阴谋论)。
该报告作者说:“我们没有看到任何从根本上误导客用户的错误答案。”
他向人工智能助理提出的问题包括:
一些人工智能助理有不错的幽默感。
有一个领域苹果Siri表现出了明显的优势:幽默感。在所有智能助理中,显然Siri最有幽默感,但现在她也变得越来越严肃了:去年,Siri给出搞笑回答的数量几乎是其他智能助理的两倍。
今年是Alexa的领跑。
微软面临的挑战显而易见。微软已经打造了一个非常有竞争力的人工智能助理......但它并没有涉足移动端或者智能音箱市场,通过这个渠道微软可以将Cortana推向市场。
因此,Cortana主要集中在Windows桌面端,而且目前还不清楚人们是否会在他们的桌面上深度使用语音。当然,Cortana不仅仅是通过语音访问的。
但是,微软仍然需要有一些方法,来有效地将他们强大的智能助理推向市场。
这也许意味着要与苹果结成伙伴……
好文章,需要你的鼓励
谷歌宣布为旗下互动世界构建工具Project Genie新增Google街景功能,用户可基于真实地点生成可探索的游戏世界。只需选定美国境内的地图位置,描述角色形象,并选择"沙漠"或"石器时代"等风格,系统即可生成与现实街景绑定的沉浸式虚拟场景。每次游玩时长限60秒,支持WASD操控,目前仅向AI Ultra订阅用户开放,后续将逐步扩展覆盖范围。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。