谷歌I/O 2026:谷歌研究院年度重大突破全览

谷歌在I/O 2026大会上集中展示了多项前沿AI研究成果。科学领域,Gemini for Science整合ERA与Co-Scientist工具,加速从神经科学到宇宙学的科研探索;医疗领域,MedGemma开源模型下载量突破500万次,健康AI助手研究成效显著;硬件方面,Coral NPU边缘AI芯片正式商用;量子计算领域,Willow芯片实现可验证量子优势。Gemma V4开源模型一个月内下载量突破1亿次。

在上周举办的Google I/O 2026大会上,谷歌各团队向用户、开发者和研究人员展示了最前沿的技术成果。以下是谷歌研究院本年度的重点亮点,这些成果往往凝聚了多年的研究积累,共同构成了从基础研究到现实落地的完整创新闭环。

今年Google I/O的突破性成果标志着一个大胆的智能体新时代的到来。借助比以往更强大的模型和智能体编程平台,谷歌正在大幅提升旗下产品对所有人的实用价值,同时推动研究人员以全新方式应对最紧迫的科学与社会挑战。随着研究成果转化为切实的现实影响,谷歌正将AI与技术塑造为人类创造力的倍增器。

以下是谷歌研究院的几大核心亮点,这些成果均是与谷歌内部众多团队及全球合作伙伴紧密协作的结晶。

AI赋能科学新发现

AI正在开创科学发现的新时代。谷歌正在构建先进的AI工具,旨在加速全球科学界的研究进程。谷歌的基础技术正在赋能全球研究人员,推动他们在各领域运用科学方法实现突破,涵盖从假设生成到计算实验的完整流程。在本届I/O大会上,谷歌发布了Gemini for Science,该产品以谷歌的基础研究为根基,其中包括上周在《自然》杂志上发表的ERA(实证研究助手)和Co-Scientist两项研究成果。

ERA是一套专为帮助科学家编写专家级实证软件而开发的研究编程系统。上周,ERA相关研究成果在《自然》上正式发表,此前历经数月与学术伙伴的深度合作,共同探索该系统的现实应用场景。ERA已助力加速从神经科学到宇宙学的多项发现。最新成果包括预测呼吸道疾病住院率以及预测加利福尼亚各流域的季节性径流。这些成果已在谷歌新建的GitHub目录中公开发布,充分展示了AI借助算力解锁更深层洞见、加速科学发现的强大潜力。

ERA的工作原理是:给定一个明确定义的问题和评分体系,ERA便作为代码优化研究引擎运行——它提出新概念、编写代码并评估结果,随后通过树搜索在数千个代码变体中迭代搜索,持续优化性能。

Co-Scientist是一个基于Gemini的多智能体系统,可作为协作式AI科研伙伴。Co-Scientist的基础研究成果上周在《自然》杂志发表,同期发布的博客中收录了多位研究人员的亲身使用体验。此前的研究与验证论文表明,研究人员正借助Co-Scientist攻克从抗菌素耐药性到植物免疫和肝纤维化等最具挑战性的科学难题。

Gemini for Science是一套实验性工具组合,旨在扩大科学探索的规模与精度,由谷歌云、Google DeepMind和Google Labs的团队携手开发。其中一项名为"计算发现(Computational Discovery)"的新工具,是基于ERA和AlphaEvolve打造的智能体研究引擎。该原型工具能够并行生成和评分数千个代码变体,使科学家能够快速测试多种假设和新颖建模方案,而这些工作若依靠人工通常需要数月时间。

每年有数以百万计的论文发表,对所有科学文献进行系统梳理已成为一项艰巨挑战。另一项名为"假设生成(Hypothesis Generation)"的新工具基于Co-Scientist构建,旨在弥合这一鸿沟——它与科学家协作定义研究挑战,并运行多智能体"创意锦标赛"来生成、辩论和评估研究假设。为确保科学严谨性,所有论断均附有可点击的引用来源。

Gemini for Science还包含基于NotebookLM构建的"文献洞见(Literature Insights)"功能,可帮助整合科学文献中的研究发现并结构化输出结果。此外,在Google Antigravity等平台上从事智能体编程的用户,还可受益于"科学技能(Science Skills)"——这是一套智能体技能集合,能让研究人员在数分钟内自动完成结构生物信息学和基因组分析等复杂工作流程,而非耗费数小时。

谷歌正在逐步开放这些工具的使用权限,并与全球科学界携手推动科学的负责任进步。如需登记使用意向,请访问 labs.google/science。

作为与生态系统合作、促进最新实验成果开放获取的重要举措,谷歌还在试点面向智能体同行评审和科学验证的工具。ICML、STOC和NeurIPS等顶级学术会议正在探索使用谷歌的论文助手工具(PAT)。在上述会议中,PAT已在实验阶段审阅了逾10,000篇论文,帮助众多作者发现关键理论缺陷,或基于AI工具的反馈开展全新实验。

谷歌还通过搭载高级智能体推理能力的Gemini Deep Think加速数学与科学发现。与数学家、物理学家和计算机科学家合作,谷歌近期成功解决了多个专家级开放研究难题,包括此前悬而未决的网络谜题死锁问题、一个困扰学界十年的优化猜想、机器学习优化异常现象的解释、拍卖经济理论的升级,以及宇宙弦中物理奇点问题的解决。

在科学家和研究人员手中,这些全新的AI技术有望彻底改变研究方式,并催生一个发现新纪元。

AI助力健康医疗

AI有望在帮助人们延长寿命、提升健康水平方面发挥重要作用。多年来,谷歌持续推进AI医疗研究,与医疗服务提供者、科学家、公共官员和学术界紧密合作,将临床研究成果引入现实医疗场景,确保各项创新安全、有益。

谷歌深入研究的领域之一,是AI如何在人们的健康与健身旅程中提供全程支持——从了解症状、准备就诊,到理解病历记录,这一旅程在人们接触医生之前便已开始,并在就诊结束后延续。谷歌的基础研究为全新的Google健康应用和Google健康教练提供了核心支撑。上周,谷歌开始向所有现有Fitbit用户推送Google健康应用,符合条件的用户可享受个性化、整体性、自适应的健康指导。

这一成果建立在谷歌多年的研究工作之上,包括个人健康大语言模型如何辅助睡眠与健身的研究。谷歌最新研究成果包括Symptom AI——一款旨在研究AI如何对与用户症状相关的对话数据进行推理的实验性工具。在一项通过Fitbit应用开展的随机知情同意研究中,共13,917名参与者与实验性AI智能体进行了交互,涵盖真实世界中多样化的沟通风格和疾病分布。在对部分研究参与者的盲测对比中,独立临床医生对Symptom AI鉴别诊断的偏好程度约为其他临床医生的两倍。在"就诊准备(Plan for Care)"试点研究中,谷歌考察了1,779名参与者如何使用该系统准备就诊。与基准模型相比,有15%更多的用户感到更加充分准备,13%更多的用户对充分利用就诊时间更有信心。在个人健康档案(PHR)研究中,谷歌评估了PHR数据对模型上下文中回答质量的影响,结果发现AI自动评分和临床医生均认为AI回答的有用性显著提升。

另一项重要研究聚焦于AI在临床环境中的应用潜力。在此前发表于《自然》的两篇论文中,谷歌研究院和Google DeepMind共同开发的研究型多智能体系统AMIE,展现了其解读和推理复杂病例及医疗对话数据的能力。上周在《自然·医学》发表的最新研究,进一步展示了AMIE处理多模态数据(包括病史、化验结果和复杂医学影像)的综合能力。为在真实场景中评估该系统的实用价值,谷歌正与Beth Israel Deaconess医疗中心合作,测试该系统如何帮助减轻患者就诊前实时问诊的工作负担。谷歌还与Included Health携手,发起了一项首创的全国规模研究,评估AI驱动的远程医疗服务效果。

推动医疗健康进步是全球共同的使命。谷歌正通过MedGemma赋能全球医疗健康开发者生态——MedGemma是谷歌"健康AI开发者基础"开放权重基础模型系列的重要组成部分,专为多模态医疗文本、临床推理和影像理解而优化。配套的MedASR则提供专业的医疗音频处理能力。这些模型正在支持多元化应用场景,助力推动优质医疗资源的普惠化获取。MedGemma迄今下载量已突破500万次。

边缘AI与Coral NPU

谷歌正在开发平台和工具,帮助硬件制造商生态系统构建高效的边缘应用。Coral NPU是谷歌为穿戴设备和传感器等边缘应用场景研发的机器学习加速器核心,专注于高能效AI推理。基于开放硬件,谷歌与深层硅提供商携手,将这一经过验证的开源IP向商业硅片集成开放,助力构建加速边缘AI生态的标准架构。

在上周的I/O大会上,谷歌发布了首款由Synaptics推出的Coralboard,专为AI和机器学习工程师及设备制造商设计,支持快速原型开发与产品构建。该开发板搭载Gemma 3 270M开放模型,并提供丰富的硬件接口,包括摄像头与显示屏支持、麦克风输入以及可选的Wi-Fi/蓝牙连接。Synaptics在推动这些解决方案走向市场方面投入了大量资源,将Coral的性能与功耗平衡优势与其自身的Devboard智能相结合。

这一业界首创实现的强大能力,在一场独特的大会前预热体验中得到了生动展示:Coralboard被部署于蒙特雷湾水族馆,实现对水母的实时端侧图像检测,并将水母的运动轨迹转化为大屏幕视觉体验的编排素材。Synaptics Coralboard将于今年夏末正式面向大众发售。

"水母电子乐(Jellectronica)"是一项生成式音乐实验,将海洋水母的运动转化为音乐。该装置在I/O大会前期展示中大放异彩,通过蒙特雷湾水族馆的实时直播呈现。水母的运动通过运行在谷歌超小型低功耗Coral NPU上的目标检测模型进行追踪。

气候预测与灾害预警

热带气旋、洪水等自然灾害往往对社区和生命造成巨大威胁。作为谷歌长期危机应对工作的重要组成部分,谷歌正在构建精准的AI驱动预测工具,帮助全球各地的社区和机构保障安全、提前应对危机。

去年,谷歌宣布与美国国家飓风中心建立合作,将谷歌研究院和Google DeepMind联合开发的WeatherNext气象模型的气旋预测能力引入该中心的预报支持体系。在本届I/O大会上,谷歌展示了WeatherNext在上个飓风季的实际效果。2025年10月,飓风梅利莎(Melissa)来袭时,WeatherNext提前五天以高置信度预测出飓风的快速增强过程和在牙买加的登陆地点。牙买加气象局得以提前向公众发布预警,有效保护了人民的生命财产安全。

另一项里程碑式的成果来自城市内涝暴洪预测领域。为攻克由数据匮乏导致的有效预测难题,谷歌创新性地引入了Groundsource——一种可扩展的新型方法论,借助Gemini将20年间海量非结构化公开新闻报道转化为包含260万条记录的高质量数据集。这些数据使谷歌得以训练用于城市地区暴洪预测的先进预报模型。相关预报已在Flood Hub平台上线,与现有河流洪水预报一同发布——后者目前已覆盖150个国家的20亿人口,涵盖最重要的洪涝事件。

WeatherNext与洪水预报模型均是Google Earth AI的组成部分。Google Earth AI是一套地理空间模型与数据集的集合,旨在将地球信息转化为可操作的智能决策依据。它已在助力企业、城市和非营利机构应对环境监测、灾害响应和公共健康支持等挑战方面取得积极成效。Earth AI的最新更新包括道路管理、人口动态以及航空与卫星洞察等新功能。

生成式AI基础研究进展

谷歌持续推进生成式AI的基础研究。与Google DeepMind携手,在事实性、多语言性和效率等多个方向的研究,有力推动了Gemini模型质量与性能的持续提升,并进一步扩大了谷歌产品的全球可及性,以更好地满足用户需求。

谷歌在大语言模型事实性研究方面起步早、积累深:早在2021年便开创性地开展了事实一致性评估研究,并于2022年建立了早期基准测试。谷歌持续推动Gemini和AI模式向前演进,并发表前沿研究成果以助力整个行业提升信息准确性。谷歌发布了FACTS基准,并对其进行扩展,以支持对大语言模型事实性的稳健评测,同时还推出了多项提升事实性的技术,涵盖文本转图像、视频生成、长上下文理解以及不确定性表达等方向。

在本届I/O大会上,谷歌观察到信息获取路径正日趋复杂,用户倾向于通过更长的多轮对话来获取所需内容。这给大语言模型带来了多重挑战:如何在上下文窗口中推理和分析更多相关信息、如何遵循对话早期设定的约束条件,以及如何支持更长的强化学习轨迹。谷歌研究院在上述所有挑战上均有开创性的研究工作,这些进展为Gemini模型提供了强劲动力。

全新的"Ask Maps"功能让用户能够在Google地图中提出更复杂、更详细的问题。谷歌与Ask Maps团队携手升级了评估框架,重新定义了地图有用性的衡量标准。通过精准定位涉及模型推理和工具调用的复杂边界案例,此次合作建立了关键的反馈闭环,对于持续提升Ask Maps的表现至关重要。谷歌还推进了研究工作,以提升"Ask YouTube"的质量——这是一项帮助用户便捷发现视频和信息的新功能。

生成式AI正在让工具和产品变得更加触手可及,真正让技术在用户所在之处发挥作用。谷歌为Gemini强化了多语言和本地化能力,包括发布了一项基准测试(揭示大语言模型在不同语言和地区的表现差异),并与社区共建、开源了非洲语言数据集。谷歌的持续努力推动Gemini扩展至全球230多个国家的70余种语言,使Gemini成为全球覆盖范围最广的AI助手。

谷歌构建的基础设施致力于实现低延迟、高吞吐量,以满足全球用户、开发者和企业的需求。谷歌研究团队在推测解码的基础上开发了全新技术,包括块验证和树形结构草稿生成——后者能够智能地同时探索多个候选续写方向,每步接受更多的Token。谷歌的实现方案针对自研TPU架构进行了深度优化,最大化硬件利用率,在不损失任何质量的前提下大幅提升响应速度。这一技术直接支撑了当前Gemini 3.5 Flash的响应速度,同样为Antigravity和AI Studio提供底层模型支持。

生成式UI与创意生成

谷歌对生成式UI的研究为Search和Gemini应用中新发布的沉浸式体验奠定了基础。在搜索方面,全新的生成式UI功能将于今年夏天面向所有用户开放。搜索可以构建最适合问题的理想回应形式,为用户提供包括模拟、图表、追踪器和仪表板在内的定制化体验。在Gemini应用中,用户将看到交互式图像、时间线和嵌入式视频。这些功能目前正在全球范围内陆续推出,带来更流畅、更自然的使用体验。

随着AI为创意创作打开全新可能,用户对高质量生成视频和图像的需求日益旺盛。谷歌研究团队与Google DeepMind紧密协作,共同提升Gemini Omni的表现——这是谷歌用于从任意输入创作任意内容的全新模型,首要能力聚焦于视频创作。谷歌着力提升了生成视频片段中故事叙述部分的质量,使其更具吸引力和感染力,尤其在改善生成片段中人物表情的质量上重点发力。

Google Antigravity与智能体时代

Google Antigravity 2.0是谷歌升级版的智能体开发平台,已于上周Google I/O大会上正式发布。该平台允许用户并行管理多个本地智能体并实现任务自动化。谷歌研究团队与谷歌各部门通力合作,在Antigravity中引入了"/teamwork-preview"智能体功能,展示了基于全新Flash模型的智能体如何执行复杂的长周期软件和机器学习工程任务。这标志着开发者生产力新时代的到来,将原本需要数天才能完成的工程工作压缩至数小时内完成。

/teamwork-preview命令工作流会唤起一个智能体对用户提示进行精炼,经用户确认后,编排智能体接管任务,派生出数十个专业子智能体,在长时间运行的会话中自主完成代码编写、测试和调试。在I/O大会的演示中,该多智能体系统从零开始构建了一个功能完整的操作系统,由自主智能体团队编写了从调度器、内存管理到文件系统的每一行代码。其他演示还包括复现AlphaZero论文,以及通过自我博弈训练构建一个有竞争力的围棋程序。

开源软件和开放获取数据集是现代科学的重要驱动力,也是推动下一代先驱性研究和产品发展的关键引擎。凭借MedGemma等开放模型、Groundsource等开放数据集,以及面向基因组学、神经科学等领域的配套工具,谷歌致力于确保创新成为全球进步的催化剂。今年4月,谷歌开源了Gemma V4——目前最先进的开放模型,专为推理、编码和智能体工作流而构建。在I/O大会上,谷歌宣布Gemma V4在发布仅一个月内下载量突破1亿次。谷歌研究团队对模型架构和训练策略进行了全面革新,在保持高效轻量足迹的同时显著提升了模型质量。这意味着开发者无需增加更重的算力资源,即可运行更加复杂的自主智能体循环。

隐私安全与量子计算

在智能体可以代替用户购物和支付、智能眼镜能够随时随地感知并引导用户的世界里,赢得并维护用户信任至关重要。随着AI能力的持续增强,隐私与数据保护成为重中之重。多年来,谷歌持续研发隐私保护技术(PPT),以保障用户数据安全。隐私保护技术可帮助从聚合匿名数据中提取洞见、改善应用体验,同时提供强有力的保证以保护个人隐私不受侵犯。例如,谷歌与谷歌搜索团队合作,利用隐私保护技术生成了关于AI模式一年使用情况的聚合洞察,并于上周对外分享。近期的隐私创新成果还包括:对用户使用聊天机器人和端侧AI方式的隐私保护聚合洞察,以及针对机器学习、大语言模型、分区选择和合成数据生成的差分隐私基础技术改进。

在上述数据保护措施的基础上,谷歌还将在高级风险管理推理方面的创新成果引入Gemini模型,持续强化AI系统,提升其对新兴风险和安全漏洞的抵御能力。

在量子计算领域,谷歌持续推进量子计算路线图,加速向量子计算现实应用的迈进。

谷歌在超导量子比特的研发上引领业界,相继实现了错误纠正和可验证量子优势等里程碑式突破。正如《自然》杂志所发表的研究成果,谷歌凭借Willow芯片,史上首次演示了实现可验证量子优势的算法——运行被称为"量子回声(Quantum Echoes)"的乱序时间关联算子(OTOC)算法。在全球最快的超级计算机上运行最优经典算法时,Willow的运行速度是其13,000倍。今年早些时候,谷歌将世界领先的量子计算研究拓展至中性原子量子计算领域——利用单个原子作为量子比特,与超导量子比特并行推进。两种技术路线的并重布局,使研究与工程突破能够相互借鉴、交叉赋能。

在I/O大会的主题演讲中,James Manyika和Hartmut Neven深入探讨了量子计算与AI的交汇前沿。这两项技术高度互补:AI已在芯片设计、错误纠正等多个维度加速推进量子计算的进展;与此同时,量子计算也有望让AI在现实世界中更加高效,因为量子计算能够比经典计算以更接近本质的方式探测自然界的量子力学规律。

上周,谷歌发布了"生命科学与量子AI交叉研究计划(REPLIQA)",这一项目向五所大学投入1000万美元,致力于将先进量子科学与AI应用于生命科学领域,以改善人类健康结果。

展望未来

Google I/O上分享的突破性成果,共同描绘出一个大胆的智能体创新新时代。这些进展深刻诠释了从研究到现实的创新闭环的强大力量——推动不可能成为可能。随着AI的持续演进,这一创新闭环正在加速运转,使研究人员得以攻克更宏大的科学命题,以更快的速度、更深远的影响作用于产品、科学与社会。

衷心感谢所有为本文撰写及相关工作做出贡献的团队与合作伙伴。

Q&A

Q1:Gemini for Science具体包含哪些工具,分别有什么用途?

A:Gemini for Science是一套实验性科学研究工具组合,主要包含以下几项:计算发现(Computational Discovery),是基于ERA和AlphaEvolve打造的智能体研究引擎,可并行生成和评分数千个代码变体,帮助科学家快速验证假设;假设生成(Hypothesis Generation),基于Co-Scientist构建,通过多智能体"创意锦标赛"来生成、辩论和评估研究假设;文献洞见(Literature Insights),基于NotebookLM构建,帮助整合和结构化科学文献发现;科学技能(Science Skills),支持研究人员在数分钟内完成结构生物信息学和基因组分析等复杂工作流。

Q2:谷歌的WeatherNext模型在飓风预测上表现怎么样?

A:WeatherNext在2025年飓风季中表现突出。当飓风梅利莎(Melissa)于2025年10月来袭时,WeatherNext提前五天以高置信度成功预测了飓风的快速增强过程以及其在牙买加的登陆地点,使牙买加气象局得以提前向公众发布预警,有效保护了当地人民的生命财产安全。这一案例充分展示了AI气象模型在实际灾害预警中的重要价值。

Q3:Gemma V4开源模型的下载量和主要特点是什么?

A:Gemma V4是谷歌于2025年4月开源的最新一代开放模型,专为推理、编码和智能体工作流而构建。在Google I/O大会上,谷歌宣布Gemma V4发布仅一个月内下载量就突破了1亿次。在技术层面,谷歌研究团队对其架构和训练策略进行了全面革新,在保持高效轻量的模型体量的同时显著提升了质量,开发者无需增加更多算力,即可运行更复杂的自主智能体循环。

来源:Google

0赞

好文章,需要你的鼓励

2026

05/29

09:45

分享

点赞

邮件订阅