周三,Amazon 分享了一个令人印象深刻的"智能代理"愿景——公司升级版的 Alexa,即 Alexa+,可以处理从餐厅预订到寻找家电维修工等无数日常琐事。
如果 Amazon 能够实现这一目标,它可能成为首个推出全面面向消费者的智能代理工具的公司。Amazon 希望将一个更自然、更具表现力的 Alexa(由生成式 AI 模型驱动)与能够完全自主、智能地访问第一方和第三方应用、服务和平台的能力结合起来。
Amazon Alexa 和 Echo 副总裁 Daniel Rausch 在周三的主题演讲中表示:"我们相信未来充满了智能代理——我们一直都这么认为。将会有许多 AI 代理为客户服务,它们中的许多都会有专门的技能...我们也一直相信,在充满 AI 的世界里,这些代理应该相互交互,为客户实现无缝衔接。"
对于一个正在努力让其历史悠久的助手重获关注度的科技巨头来说,这将是一个重大胜利。Amazon 多年来在 Alexa 上投入巨资,却没有获得显著的收入回报;据报道,该公司的硬件部门已经烧掉了数十亿美元。
智能代理是一个模糊且日益泛化的术语,指的是可以代表用户采取行动的 AI 模型,是 AI 领域的下一个重要发展方向。科技行业将智能代理视为从日益复杂的模型中提取价值的关键。智能代理承诺可以处理各种简单的任务和日程安排,提高人们和企业的整体生产力。
至少这是其理念。到目前为止,智能代理的表现大多令人失望。
包括 Anthropic 和 OpenAI 在内的主要 AI 实验室已经推出了可以控制浏览器执行操作的智能代理。但它们经常出错,完成较复杂的任务时需要相当程度的人工干预。其他雄心勃勃的智能代理尝试,如 Google 的 Project Mariner,仍处于原型阶段,没有确定的发布时间表。
Amazon 展示的 Alexa+(计划从下月开始预览版发布)描绘了一个更加完善的智能代理体验——几乎没有技术障碍。该公司展示了助手如何从电子邮件、日历和存储的偏好等各种来源提取信息,以协助处理日常事务。
在周三上午纽约新闻发布会的一个预览中,Amazon 展示了 Alexa+ 如何制作杂货购物清单,然后通过与 Amazon Fresh、Whole Foods 和其他本地连锁店的集成进行订购。在另一个演示中,公司强调了 Alexa+ 如何能在商品降价时自动在 Amazon 上购买,并通过健康应用 Vagaro 预约水疗和健身课程。
据 Amazon 介绍,智能代理的功能远不止于此。Alexa+ 可以通过 Grubhub 下订外卖,叫 Uber,在 Ticketmaster 上查找即将举行的音乐会门票,利用 Tripadvisor 等资源制定旅行计划,甚至可以从活动传单中提取关键日期和时间来设置提醒。
听起来好得难以置信?
这一切听起来都非常令人兴奋且雄心勃勃。考虑到零售商多年来积累的购物者习惯数据以及与主要科技生态系统和服务的合作关系,Amazon 可以说处于成功的有利位置。愿意提供自己数据的 Alexa+ 用户将受益于更个性化、量身定制的智能代理体验。Alexa+(通常每月收费 19.99 美元)将对 Prime 会员免费,这并非偶然,因为他们是 Amazon 最忠实的用户群体。
Amazon 还指望其庞大的 Alexa 设备基础(超过 6 亿台设备)来推动 Alexa+ 的普及。由于许多家庭已经拥有兼容 Alexa 的音箱,该公司认为对许多用户来说,选择 Alexa+ 将是一个显而易见的选择。
也许 Amazon 最大的挑战将是克服当今 AI 技术的局限性。据报道,由于模型行为异常,Alexa+ 已多次推迟发布;早期版本无法正确回答问题,甚至在开关智能灯具时都会遇到困难。
值得注意的是,竞争对手在智能代理工具方向上的尝试也遇到了挫折。OpenAI 的用于编写研究报告的智能代理模型 ChatGPT deep research 有时会产生幻觉。同时,Google 的 Gemini 聊天机器人会输出事实错误的电子邮件摘要。
在周三的新闻发布会上,很难了解 Alexa+ 的实际表现。许多演示都经过精心编排,Amazon 也没有让与会者长时间使用这款新助手。
我们需要等待亲自测试 Alexa+ 才能知道它是否接近实现 Amazon 的智能代理销售主张。如果确实如此,这将是一个非常令人印象深刻的成就——也可能让 Amazon 在消费者智能代理竞赛中领先一步。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。