OpenAI 正通过一系列对 ChatGPT 搜索能力的更新向 Google LLC 发起挑战,其中包括一项全新的购物体验,提供产品推荐以及一键购买链接。
公司表示,今天在 ChatGPT 上宣布的新购物功能将使用户能够搜索产品,并在点击链接后购买产品——该链接会将用户重定向至商家网站。此更新将向所有用户推出,无论是否登录账户。
Wired.com 首次报道了此次更新,该网站曾观看过新购物推荐功能的演示。用户如果向 ChatGPT 询问关于咖啡机或办公椅等产品的推荐,将会根据其表达的偏好、多来源的产品评价以及 ChatGPT 对每位用户的“存储记忆”展示出多种合适产品。
此次更新使得 OpenAI 向 Google 发起挑战。ChatGPT 的购物体验与 Google Shopping 非常相似,当用户点击一个产品图片时,会显示出来自多个零售商(例如 Amazon.com Inc. 和 Walmart Inc.)的链接及其价格。如果用户点击链接,就可以通过相应零售商进行购买。
在接受 Wired 采访时,OpenAI 搜索产品负责人 Adam Fry 表示,公司目前正在尝试多个不同的产品类别,包括美容产品、电子产品、家居用品及时尚单品。他解释说,ChatGPT 结果中展示的产品评价取自多个在线渠道,包括购买指南出版商、像 Amazon 这样的网站以及 Reddit 等论坛。用户还可以指定 ChatGPT 优先考虑某个特定的评价来源,从而缩小搜索结果范围。
Fry 强调,OpenAI 并非试图与 Google 基于算法的购物推荐方式竞争。虽然普遍认为 Google 那不透明的购物搜索算法倾向于优先展示那些评价较为充分且真实的产品,但 ChatGPT 则致力于更具体地理解这些评价与用户需求及其先前表达偏好的关联。因此,如果某人在之前的对话中曾告诉 ChatGPT 自己偏好某种风格的服装或钟爱特定品牌,系统会记住这些信息,并在推荐时予以考虑。
虽然这一体验与 Google Shopping 十分相似,Fry 迅速指出 ChatGPT 目前并未展示任何赞助产品推荐——至少现阶段是如此。
TechCrunch 引用 Fry 的话称,OpenAI 不会通过 ChatGPT 直接从促成的销售中获取收入,但 Wired 指出,此举可能会影响到第三方联盟的收益。
例如,每当有人阅读 Wired 的产品评价并点击购买该产品时,Wired 都能获得一部分收入分成。然而,ChatGPT 用户可能基于这些评价做出购买决策而不点击原文链接,从而实际上将联盟分成排除在外,尽管系统是抓取了该网站的内容。
当被问及 OpenAI 是否计划以某种方式补偿联盟时,Fry 表示,公司将“尝试”多种方式确保联盟仍能从每笔交易中获得分成,但他拒绝透露具体细节。他表示,目前公司更专注于完善其产品推荐系统。因此,对于依赖联盟收入的评价网站来说,这可能不是个好消息。
Fry 同样拒绝对此发表评论,说明 ChatGPT 未来是否会在其购物推荐中包含赞助结果。不过,如果基于 ChatGPT 的购物功能获得成功,公司恐怕难以抵挡引入赞助结果的诱惑。
除了改进的购物体验外,OpenAI 还表示,ChatGPT 现在会显示一份用户搜索的“热门流行搜索”列表。它还模仿 Google,引入了一项新的自动补全功能,因此当用户开始输入查询问题时,系统会显示相关建议,帮助用户免去输入完整问题的麻烦。
这些更新凸显了 OpenAI 在网络搜索业务中颠覆 Google 的决心。公司早在十月就首次在 ChatGPT 中推出了网页搜索功能,使其能够推荐产品并分析网络上发布的最新信息。此外,公司还推出了一款实验性“agentic” Operator 工具,该工具允许 ChatGPT 使用网页浏览器代替用户执行在线操作。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。