根据 Google 周三发布的博客文章,公司正在将 AI 概览功能扩展到更多美国用户,并对其进行 Gemini 2.0 升级。
AI 概览是 Google 搜索的一项功能,它会在显示常规蓝色链接之前,使用 AI 自动生成带有视频和引用的查询答案。现在,该功能将支持更多类型的查询,如编程代码和高级数学方程,且用户无需登录即可使用。从视觉效果上看,界面保持不变。
除了更新 AI 概览功能外,Google 还在搜索中推出了一项名为 AI 模式的新实验。对于通过候补名单的用户,AI 模式将与地图、图片和购物等功能一起显示在 Google 搜索查询的顶部栏中。根据 Google 的说法,AI 模式的工作方式类似于与 ChatGPT 竞争的 Google Gemini AI 聊天机器人,它使用了一个将 Gemini 2.0 与搜索核心排名系统整合的定制模型。
当被要求置评时,Google 引用了其博客文章作为回应。
AI 概览的更新和 AI 模式的引入是 Google 在其产品组合中整合更多 AI 产品的一部分。从 Gmail 到 Pixel,几乎每个 Google 产品都融入了 AI 元素。甚至连 YouTube 的评论区也在使用 AI 进行总结。
搜索是 Google 最有价值的产品,因此当公司宣布将 AI 引入数十亿人每天使用的工具时,引发了一些担忧。在推出时,AI 概览曾出现引人注目的错误,比如建议人们在披萨中加入胶水。一年后,用户仍然报告 AI 概览给出奇怪的答案和明显的错误。这甚至促使一些人寻找方法配置 Google 搜索以移除 AI 概览。尽管出现这些失误,AI 概览并未影响公司的股价,而 Google 表示 AI 模式的推出是对用户需求的回应。
据报道,Google 似乎将继续在 AI 领域加大投入,公司将为即将推出的 Pixel 10 系列设备推出一款名为 Pixie 的设备端 AI 助手。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。