亚马逊宣布,目前正在部分产品页面测试短格式 AI 驱动的音频产品摘要。音频摘要由亚马逊所谓的 “AI 驱动购物专家” 配音,他们会讨论产品的关键特性、客户评论以及来自全网的信息。
新的 AI 产品摘要可以通过在亚马逊购物 app 中点击 “听听亮点” 按钮进行访问。公司表示,将在那些通常需要购买前仔细考虑的产品中测试这一新功能。
这一功能的设计理念是帮助亚马逊顾客在购物时节省时间,并以对话讨论的方式传递重要信息。
“这一功能使得产品调研既有趣又便捷——就像有一群乐于助人的朋友在讨论潜在的购买选择,即使您在多任务处理或出行过程中,也能让购物变得更加轻松,”公司在博客中写道。
目前,这些摘要仅向部分美国消费者的精选产品开放。亚马逊计划在未来几个月内,将这一功能扩展到更多产品和更多美国客户。
公司解释称,该功能利用大语言模型 ( LLM ) 生成脚本,通过整合客户评论及全网信息,再将这些内容转化为短格式音频剪辑。
亚马逊表示,这项新功能加入了其现有的 AI 驱动购物功能套件,其中包括生成式 AI 购物助手 Rufus 以及 Interests —— 一项监控与您兴趣匹配的新产品的 AI 功能。
亚马逊并非唯一一家利用短格式 AI 驱动音频帮助用户快速高效获取信息的科技巨头。去年,Google 的 NotebookLM 推出了 Audio Overviews 功能,使用户能够基于与 AI 研究助手共享的文档(例如课程阅读材料或法律摘要),生成由 AI 虚拟主持人主持的播客。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。