科学发现的真正价值,在于能够赋能他人进行复现与拓展,从而不断推动科学边界向前延伸。谷歌研究院认为,开源软件与开放数据集是推动现代科学发展的重要动力。以负责任的方式创建这些资源,并通过与全球科学界的合作持续维护它们,正是协作精神的具体体现。正是通过这种方式,谷歌研究院践行开放科学的理念,确保创新不是孤立事件,而是推动全球进步的催化剂。
无论是重塑自动化语言处理的Transformer架构,还是在医学、基因组学、神经科学、气候、能源及物理、生命与社会科学等多个领域带来变革的专业模型,谷歌研究院为能够分享这些成果、并看到全球研究人员借助它们取得突破性发现而感到自豪。这种开放理念与谷歌在研究和科学生态系统方面的广泛举措相辅相成,包括通过API、学术发表、学术会议、受信测试计划及私人合作伙伴关系等多种方式深化参与。
全球合作网络
谷歌研究院与多个科学领域和全球各地区的专业机构开展合作,包括加州大学圣克鲁兹分校基因组学研究所、贾内利亚研究园区、奥地利科学技术研究所、人口基因组学中心、澳大利亚国家科学机构CSIRO,以及全印度医学科学研究所(AIIMS)。
除与单个机构合作外,谷歌研究院还积极支持多个承担重大全球性挑战的科学联盟,包括人类泛基因组研究联盟、地球生物基因组计划以及美国国立卫生研究院脑计划。
在更广泛的生态系统层面,谷歌研究院致力于为科学开发者个人构建实践社区,目前已率先在印度、韩国、日本和澳大利亚展开布局。
开放资源与开发者社区
过去十年间,谷歌研究院持续开发、发布、维护并迭代多项核心开源技术与开放数据集,迄今已为全球超过25万名活跃研究人员和开发者提供支持。
其中一个典型案例来自脑科学领域——在人类大脑碎片重建图像中,一个单独神经元(白色)接收决定其是否触发的信号,图像清晰呈现了所有促进触发的轴突(绿色)与抑制触发的轴突(蓝色)。这一图像由谷歌研究院与哈佛大学利希特曼实验室联合完成,渲染工作由哈佛大学D. Berger负责。
开放科学的实际影响
开放科学理念的真正衡量标准,是合作伙伴与最终用户所取得的实际成果。以下是部分案例:
非洲非营利机构Sunbird AI利用谷歌开放建筑数据集,更准确地了解城乡社区的能源需求;全印度医学科学研究所正借助MedGemma开发门诊分诊与皮肤科筛查应用;此外,物种识别工具SpeciesNet已被用于识别塞伦盖蒂国家公园的大象、斑马、秘书鸟,以及哥伦比亚、爱达荷州等地的多种野生动物。
面向AI时代的开放科学未来
谷歌研究院与开放科学社区的合作正在持续深化。随着科学研究全面迈入AI赋能时代,生成式AI正深刻改变研究人员的工作与协作方式。谷歌研究院相信,智能体工作流将使科学家能够将知识编码为专业技能,并将研究方法转化为可访问、可扩展的工具。这一转变将赋能全球社区快速复现研究成果、延伸复杂方法论,并在全球范围内共享研究成就。
在这个快速演进的新范式下,沟通与协作比以往任何时候都更为关键。开源软件与开放数据集是支撑这一生态系统的根本基础。今天所庆祝的突破,仅仅是迈向更快速创新、更普惠科学知识共享世界的初步蓝图。
谷歌研究院将继续构建支持这一新发现时代的工具与基础设施,并期待见证全球科学界在此基础上取得的下一个重大成就。谷歌研究院特别感谢众多全球研究合作伙伴,以及广泛的科学用户社区——正是他们基于开放模型、基础设施、数据集和其他工具持续探索,推动着具有积极全球影响的创新落地。
Q&A
Q1:谷歌开放建筑数据集是什么?能解决什么问题?
A:谷歌开放建筑数据集是谷歌研究院发布的一项开放数据资源,收录了全球范围内建筑物的位置与分布信息。非洲非营利机构Sunbird AI利用这一数据集,更准确地分析城市和农村社区的能源需求,帮助相关机构制定更有针对性的能源供应方案,从而支持资源匮乏地区的可持续发展。
Q2:MedGemma是什么?全印度医学科学研究所如何使用它?
A:MedGemma是谷歌研究院面向医疗场景推出的专业AI模型。全印度医学科学研究所(AIIMS)正在基于MedGemma开发两类应用:一是门诊分诊系统,帮助医院更高效地对患者进行初步评估和分流;二是皮肤科筛查工具,辅助医生进行皮肤疾病的早期识别,旨在提升医疗资源有限地区的诊疗效率。
Q3:Transformer架构对科学研究有什么影响?
A:Transformer是谷歌研究院开发并开源的一种深度学习架构,最初用于自然语言处理,后来被广泛应用于多个科学领域。它不仅重塑了自动化语言处理方式,还衍生出多种专业模型,推动了医学、基因组学、神经科学、气候科学和能源研究等领域的重大进展,成为现代AI驱动科研的重要基础。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。