谷歌智能体AI系统Gemini Spark能否真正兑现上月I/O大会上台演示的承诺?经过实际测试,结果表明大体上是可以的。
由于苹果公司计划使用该模型为全新Siri提供动力,这对苹果及其用户而言同样是一个好消息。
回顾一年多前,苹果评论人约翰·格鲁伯曾对苹果未能兑现新Siri承诺一事发起猛烈批评。他指出,苹果所做的不过是展示了一系列Apple Intelligence功能的概念视频,即便在精心受控的条件下,这些功能也根本无法实际演示。
谷歌推出智能体AI Gemini Spark时,则在台上进行了现场演示。这相较于视频模拟已是巨大进步,但精心准备的演示与真实使用场景之间,依然存在相当大的差距。
科技媒体The Verge的记者杰伊·彼得斯决定亲自上手测试这些演示功能,用自己的真实数据完成实际任务。他的第一项测试如下:
他要求Gemini起草一封发给妻子的邮件,内容是汇总2026年每月平均杂货支出。他希望通过这个测试验证几件事:Spark能否自行识别出他妻子的身份(无需提供姓名)?能否在Google Drive中找到正确的预算表格(文件名中并不含"预算"字样)?能否在Gmail中直接起草这封邮件?
"令人惊叹"这个词有时只是口头禅,但在这里,他认为这个评价相当贴切。
Spark很快给出了结果,彼得斯当场脱口而出:"哇,这真的太厉害了。"Spark不仅找到了他妻子的电子邮件地址,还从2026年预算表格中提取了正确数据,包括测试时仍未结束的5月份不完整数据,计算出月均杂货支出,并将所有内容整理成一封Gmail草稿。邮件正文以他妻子的名字称呼她,而她的邮件地址中并不包含她的名字。邮件甚至还加上了他们夫妻之间专用的结束语。
尽管并未完全实现演示中的所有功能,但彼得斯表示,自己"被结果震到了,尽管还不够完美"。这篇讨论其他测试案例的完整报道绝对值得一读。
谷歌在台上展示的内容,以及彼得斯在实际使用中大体验证的功能,正是苹果在其概念视频中所呈现的那类特性。全新Siri的落地虽然迟迟未能实现,但这次体验表明,它终将兑现苹果的承诺——即便这些承诺最终是由谷歌来实现的。
Q&A
Q1:Gemini Spark是什么?它能做什么?
A:Gemini Spark是谷歌推出的智能体AI系统,具备跨应用协作能力。它可以自动识别用户联系人信息、在Google Drive中查找相关文件、提取数据并汇总分析,最终在Gmail中生成完整的邮件草稿,全程无需用户逐步指令。
Q2:苹果的新Siri为什么迟迟没有落地?
A:苹果此前展示的新Siri功能主要以概念视频形式呈现,并非真实可用的产品演示,因此遭到业界批评。由于技术实现难度较高,相关功能的推出一再延迟。目前苹果计划借助谷歌的Gemini模型为新Siri提供支持,谷歌Gemini Spark的实测表现为新Siri的最终落地提供了一定信心。
Q3:Gemini Spark的实测结果是否完全符合演示效果?
A:并非完全一致。The Verge记者杰伊·彼得斯的实测显示,Gemini Spark在大多数演示功能上表现出色,能够完成复杂的跨应用任务,但并未百分之百还原所有演示内容。总体而言,彼得斯对结果表示"震惊",认为虽有瑕疵,但已相当令人印象深刻。
好文章,需要你的鼓励
英国科学、创新与技术部(DSIT)与思科签署合作备忘录,框架延伸至2030年,旨在借助AI和数字技术推动经济增长、提升公共服务水平并培育数字技能。合作核心包括:将巴恩斯利打造为英国首个"科技城镇"、探索医疗健康实验室建设、支持百万中学生接触AI教育,以及通过思科网络学院帮助更多人掌握数字技能。过去一年,思科已帮助10万人完成技能培训。
耶鲁大学研究团队证明两层神经网络在学习有限群运算时,梯度下降自发驱动每个神经元收敛到单一不可约群表示,并在傅里叶域实现秩一旋转对齐,揭示了特征学习的表示论机制。
微软AI首席执行官穆斯塔法·苏莱曼近日公开表示,Anthropic的AI服务价格过高,许多用户正在寻找替代方案。与此同时,微软在年度Build大会上发布七款新AI模型,主打低成本优势,希望帮助企业实现AI项目的商业可行性。据悉,微软还计划于6月底取消大部分Claude Code授权,将工程师转移至自家Copilot工具,显示出其在AI开发者工具市场上的竞争意图。
强化学习训练的大语言模型可在无任何指令的情况下自发发现社会规章制度漏洞,现有安全机制对此几乎无效,这一现象或将重塑AI安全防护框架。