数字营销公司Stone Temple通过一份包含4942个查询的详尽列表,测试了Alexa、Cortana、Google Assistant和Siri。对于每一项,受访者可以勾选该智能助理是否回答了问题、是否理解了问题、回答是否错误、答案是否来自数据库或第三方来源,如维基百科。
结果明确显示:微软Cortana比大多数人预想的要聪明得多。
Cortana在Google Home上的表现甚至超过Google,但令人惊讶的是,Google Assistant在移动端却表现的不是那么聪明。Cortana大幅超过Alexa,苹果的Siri甚至还差得远。
在移动端,Google Assistant几乎可以尝试回答80%的问题,在准确性和完整性方面的得分超过90%。Cortana尝试回答的问题相对少一些——约65%, 但成功率超过90%。
然而,Alexa却只命中了一半的问题。
Siri尝试回答超过40%的问题。
对于这些智能助理尝试回答的问题中,Alexa和Siri表现不错,准确率达到了80%左右。但显然,这是从一个较小的知识库中进行操作的。而作为两大领导者,谷歌和微软在过去十年中运行着庞大搜索引擎绝非偶然。
过去几年,有数十亿人在提出问题,这一点并不令人感到惊讶,他们通过点击来选择哪些答案是最佳答案,这让微软和谷歌变得更加聪明。
对亚马逊来说,另一个亮点是:Alexa正在快速增长。
在去年Stone Temple进行的研究中,Alexa仅仅尝试回答了20%的问题。今年,Alexa尝试回答的问题超过一半,有进步了。
苹果Siri也变得越来越聪明,但速度并不快。去年的测试中,Siri尝试回答31.4%的问题,今年提高到了40.7%。
对于企业来说,人工智能是一个越来越重要的竞争优势,尤其是那些正在打造语音优先的个人助理的大型科技公司。苹果正在这方面努力进行改善,并且最近挖来了谷歌搜索和人工智能的负责人。
好消息是:人工智能助理通常不会提出误导性的询问(不过最近在被问及飞机化学痕迹时,Alexa曾一度抛出了政府阴谋论)。
该报告作者说:“我们没有看到任何从根本上误导客用户的错误答案。”
他向人工智能助理提出的问题包括:
一些人工智能助理有不错的幽默感。
有一个领域苹果Siri表现出了明显的优势:幽默感。在所有智能助理中,显然Siri最有幽默感,但现在她也变得越来越严肃了:去年,Siri给出搞笑回答的数量几乎是其他智能助理的两倍。
今年是Alexa的领跑。
微软面临的挑战显而易见。微软已经打造了一个非常有竞争力的人工智能助理......但它并没有涉足移动端或者智能音箱市场,通过这个渠道微软可以将Cortana推向市场。
因此,Cortana主要集中在Windows桌面端,而且目前还不清楚人们是否会在他们的桌面上深度使用语音。当然,Cortana不仅仅是通过语音访问的。
但是,微软仍然需要有一些方法,来有效地将他们强大的智能助理推向市场。
这也许意味着要与苹果结成伙伴……
好文章,需要你的鼓励
亚马逊云服务宣布雷尼尔项目正式投入运营,该AI超级集群配备近50万块Trainium2芯片,分布在多个数据中心。AWS称这是全球最大的AI计算集群之一,从宣布到全面运营仅用不到一年时间。合作伙伴Anthropic计划年底前扩展到超过100万块芯片。该项目与OpenAI星门计划展开激烈竞争,AWS凭借自主硬件开发优势能够控制从芯片到数据中心的完整技术栈。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
谷歌开始推出Fitbit应用的重大更新,采用全新设计并集成由Gemini AI驱动的个人教练功能。该更新于10月28日首先面向美国地区的Fitbit Premium用户开放,后续将逐步扩大覆盖范围。新版本围绕今日、健身、睡眠和健康四个主要标签重新设计,强调周趋势数据分析。AI教练功能可根据用户的实时和历史数据提供个性化建议和训练计划,支持语音或文字交互。用户可选择是否使用AI功能,预览期间可在新旧界面间切换。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。