数字营销公司Stone Temple通过一份包含4942个查询的详尽列表,测试了Alexa、Cortana、Google Assistant和Siri。对于每一项,受访者可以勾选该智能助理是否回答了问题、是否理解了问题、回答是否错误、答案是否来自数据库或第三方来源,如维基百科。
结果明确显示:微软Cortana比大多数人预想的要聪明得多。
Cortana在Google Home上的表现甚至超过Google,但令人惊讶的是,Google Assistant在移动端却表现的不是那么聪明。Cortana大幅超过Alexa,苹果的Siri甚至还差得远。
在移动端,Google Assistant几乎可以尝试回答80%的问题,在准确性和完整性方面的得分超过90%。Cortana尝试回答的问题相对少一些——约65%, 但成功率超过90%。
然而,Alexa却只命中了一半的问题。
Siri尝试回答超过40%的问题。
对于这些智能助理尝试回答的问题中,Alexa和Siri表现不错,准确率达到了80%左右。但显然,这是从一个较小的知识库中进行操作的。而作为两大领导者,谷歌和微软在过去十年中运行着庞大搜索引擎绝非偶然。
过去几年,有数十亿人在提出问题,这一点并不令人感到惊讶,他们通过点击来选择哪些答案是最佳答案,这让微软和谷歌变得更加聪明。
对亚马逊来说,另一个亮点是:Alexa正在快速增长。
在去年Stone Temple进行的研究中,Alexa仅仅尝试回答了20%的问题。今年,Alexa尝试回答的问题超过一半,有进步了。
苹果Siri也变得越来越聪明,但速度并不快。去年的测试中,Siri尝试回答31.4%的问题,今年提高到了40.7%。
对于企业来说,人工智能是一个越来越重要的竞争优势,尤其是那些正在打造语音优先的个人助理的大型科技公司。苹果正在这方面努力进行改善,并且最近挖来了谷歌搜索和人工智能的负责人。
好消息是:人工智能助理通常不会提出误导性的询问(不过最近在被问及飞机化学痕迹时,Alexa曾一度抛出了政府阴谋论)。
该报告作者说:“我们没有看到任何从根本上误导客用户的错误答案。”
他向人工智能助理提出的问题包括:
一些人工智能助理有不错的幽默感。
有一个领域苹果Siri表现出了明显的优势:幽默感。在所有智能助理中,显然Siri最有幽默感,但现在她也变得越来越严肃了:去年,Siri给出搞笑回答的数量几乎是其他智能助理的两倍。
今年是Alexa的领跑。
微软面临的挑战显而易见。微软已经打造了一个非常有竞争力的人工智能助理......但它并没有涉足移动端或者智能音箱市场,通过这个渠道微软可以将Cortana推向市场。
因此,Cortana主要集中在Windows桌面端,而且目前还不清楚人们是否会在他们的桌面上深度使用语音。当然,Cortana不仅仅是通过语音访问的。
但是,微软仍然需要有一些方法,来有效地将他们强大的智能助理推向市场。
这也许意味着要与苹果结成伙伴……
好文章,需要你的鼓励
文章详细介绍了Character.AI这款主要面向娱乐、角色扮演和互动叙事的AI聊天工具的原理、用户群体、特色功能以及面临的法律与伦理争议,同时揭示了其新推出的视频和游戏互动体验。
上海人工智能实验室研究团队开发了MMSI-Bench,这是首个专注于多图像空间智能评估的全面基准。研究人员花费300多小时,从12万张图像中精心构建了1000道问题,涵盖了位置关系、属性和运动等多种空间推理任务。评测结果显示,即使最先进的AI模型也仅达到41%的准确率,远低于人类的97%,揭示了AI空间认知能力的重大缺陷。研究还识别了四类主要错误:物体识别错误、场景重建错误、情境转换错误和空间逻辑错误,为未来改进提供了明确方向。
思科报告指出,自主型人工智能未来三年内有望承担高达68%的客户服务任务,通过个性化与前瞻性支持提升效率与节省成本,但用户仍重视人与人之间的互动和健全的治理机制。
卡内基梅隆大学研究团队开发了ViGoRL系统,通过视觉定位强化学习显著提升AI的视觉推理能力。该方法让模型将每个推理步骤明确锚定到图像的特定坐标,模拟人类注视点转移的认知过程。与传统方法相比,ViGoRL在SAT-2、BLINK等多项视觉理解基准上取得显著提升,并能动态放大关注区域进行细节分析。这种定位推理不仅提高了准确性,还增强了模型解释性,为更透明的AI视觉系统铺平道路。