根据 Google 周三发布的博客文章,公司正在将 AI 概览功能扩展到更多美国用户,并对其进行 Gemini 2.0 升级。
AI 概览是 Google 搜索的一项功能,它会在显示常规蓝色链接之前,使用 AI 自动生成带有视频和引用的查询答案。现在,该功能将支持更多类型的查询,如编程代码和高级数学方程,且用户无需登录即可使用。从视觉效果上看,界面保持不变。
除了更新 AI 概览功能外,Google 还在搜索中推出了一项名为 AI 模式的新实验。对于通过候补名单的用户,AI 模式将与地图、图片和购物等功能一起显示在 Google 搜索查询的顶部栏中。根据 Google 的说法,AI 模式的工作方式类似于与 ChatGPT 竞争的 Google Gemini AI 聊天机器人,它使用了一个将 Gemini 2.0 与搜索核心排名系统整合的定制模型。
当被要求置评时,Google 引用了其博客文章作为回应。
AI 概览的更新和 AI 模式的引入是 Google 在其产品组合中整合更多 AI 产品的一部分。从 Gmail 到 Pixel,几乎每个 Google 产品都融入了 AI 元素。甚至连 YouTube 的评论区也在使用 AI 进行总结。
搜索是 Google 最有价值的产品,因此当公司宣布将 AI 引入数十亿人每天使用的工具时,引发了一些担忧。在推出时,AI 概览曾出现引人注目的错误,比如建议人们在披萨中加入胶水。一年后,用户仍然报告 AI 概览给出奇怪的答案和明显的错误。这甚至促使一些人寻找方法配置 Google 搜索以移除 AI 概览。尽管出现这些失误,AI 概览并未影响公司的股价,而 Google 表示 AI 模式的推出是对用户需求的回应。
据报道,Google 似乎将继续在 AI 领域加大投入,公司将为即将推出的 Pixel 10 系列设备推出一款名为 Pixie 的设备端 AI 助手。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。