周三,Amazon 分享了一个令人印象深刻的"智能代理"愿景——公司升级版的 Alexa,即 Alexa+,可以处理从餐厅预订到寻找家电维修工等无数日常琐事。
如果 Amazon 能够实现这一目标,它可能成为首个推出全面面向消费者的智能代理工具的公司。Amazon 希望将一个更自然、更具表现力的 Alexa(由生成式 AI 模型驱动)与能够完全自主、智能地访问第一方和第三方应用、服务和平台的能力结合起来。
Amazon Alexa 和 Echo 副总裁 Daniel Rausch 在周三的主题演讲中表示:"我们相信未来充满了智能代理——我们一直都这么认为。将会有许多 AI 代理为客户服务,它们中的许多都会有专门的技能...我们也一直相信,在充满 AI 的世界里,这些代理应该相互交互,为客户实现无缝衔接。"
对于一个正在努力让其历史悠久的助手重获关注度的科技巨头来说,这将是一个重大胜利。Amazon 多年来在 Alexa 上投入巨资,却没有获得显著的收入回报;据报道,该公司的硬件部门已经烧掉了数十亿美元。
智能代理是一个模糊且日益泛化的术语,指的是可以代表用户采取行动的 AI 模型,是 AI 领域的下一个重要发展方向。科技行业将智能代理视为从日益复杂的模型中提取价值的关键。智能代理承诺可以处理各种简单的任务和日程安排,提高人们和企业的整体生产力。
至少这是其理念。到目前为止,智能代理的表现大多令人失望。
包括 Anthropic 和 OpenAI 在内的主要 AI 实验室已经推出了可以控制浏览器执行操作的智能代理。但它们经常出错,完成较复杂的任务时需要相当程度的人工干预。其他雄心勃勃的智能代理尝试,如 Google 的 Project Mariner,仍处于原型阶段,没有确定的发布时间表。
Amazon 展示的 Alexa+(计划从下月开始预览版发布)描绘了一个更加完善的智能代理体验——几乎没有技术障碍。该公司展示了助手如何从电子邮件、日历和存储的偏好等各种来源提取信息,以协助处理日常事务。
在周三上午纽约新闻发布会的一个预览中,Amazon 展示了 Alexa+ 如何制作杂货购物清单,然后通过与 Amazon Fresh、Whole Foods 和其他本地连锁店的集成进行订购。在另一个演示中,公司强调了 Alexa+ 如何能在商品降价时自动在 Amazon 上购买,并通过健康应用 Vagaro 预约水疗和健身课程。
据 Amazon 介绍,智能代理的功能远不止于此。Alexa+ 可以通过 Grubhub 下订外卖,叫 Uber,在 Ticketmaster 上查找即将举行的音乐会门票,利用 Tripadvisor 等资源制定旅行计划,甚至可以从活动传单中提取关键日期和时间来设置提醒。
听起来好得难以置信?
这一切听起来都非常令人兴奋且雄心勃勃。考虑到零售商多年来积累的购物者习惯数据以及与主要科技生态系统和服务的合作关系,Amazon 可以说处于成功的有利位置。愿意提供自己数据的 Alexa+ 用户将受益于更个性化、量身定制的智能代理体验。Alexa+(通常每月收费 19.99 美元)将对 Prime 会员免费,这并非偶然,因为他们是 Amazon 最忠实的用户群体。
Amazon 还指望其庞大的 Alexa 设备基础(超过 6 亿台设备)来推动 Alexa+ 的普及。由于许多家庭已经拥有兼容 Alexa 的音箱,该公司认为对许多用户来说,选择 Alexa+ 将是一个显而易见的选择。
也许 Amazon 最大的挑战将是克服当今 AI 技术的局限性。据报道,由于模型行为异常,Alexa+ 已多次推迟发布;早期版本无法正确回答问题,甚至在开关智能灯具时都会遇到困难。
值得注意的是,竞争对手在智能代理工具方向上的尝试也遇到了挫折。OpenAI 的用于编写研究报告的智能代理模型 ChatGPT deep research 有时会产生幻觉。同时,Google 的 Gemini 聊天机器人会输出事实错误的电子邮件摘要。
在周三的新闻发布会上,很难了解 Alexa+ 的实际表现。许多演示都经过精心编排,Amazon 也没有让与会者长时间使用这款新助手。
我们需要等待亲自测试 Alexa+ 才能知道它是否接近实现 Amazon 的智能代理销售主张。如果确实如此,这将是一个非常令人印象深刻的成就——也可能让 Amazon 在消费者智能代理竞赛中领先一步。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。