谷歌让AI更易获取真实世界数据

谷歌发布数据共享模型上下文协议服务器，使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻觉问题，为AI提供可验证的结构化信息。谷歌还与ONE Campaign合作推出数据智能体工具，该开源服务器兼容任何大语言模型。

谷歌正在将其庞大的公共数据宝库转化为AI的金矿，推出了数据共享模型上下文协议(MCP)服务器，使开发者、数据科学家和AI智能体能够通过自然语言访问真实世界的统计数据，从而更好地训练AI系统。

谷歌数据共享平台于2018年推出，整合了来自政府调查、地方行政数据以及联合国等全球机构统计数据等各种来源的公共数据集。随着MCP服务器的发布，这些数据现在可以通过自然语言访问，让开发者能够将其集成到AI智能体或应用程序中。

AI系统通常使用嘈杂、未经验证的网络数据进行训练。再加上它们在缺乏来源时"填补空白"的倾向，这会导致产生幻觉。因此，希望针对特定用例对AI系统进行微调的公司往往需要获取大量高质量数据集。通过公开发布数据共享的MCP服务器，谷歌旨在解决这两个挑战。

数据共享的新MCP服务器连接了从人口普查数据到气候统计等公共数据集与日益依赖准确结构化上下文的AI系统。通过使这些数据可以通过自然语言提示访问，此次发布旨在让AI建立在可验证的真实世界信息基础上。

"模型上下文协议让我们能够利用大语言模型的智能，在正确的时间选择正确的数据，而无需了解我们如何建模数据或API如何工作，"谷歌数据共享负责人Prem Ramaswami在采访中表示。

MCP最初由Anthropic于去年11月推出，是一个开放的行业标准，使AI系统能够从各种来源访问数据，包括商业工具、内容存储库和应用开发环境，为理解上下文提示提供了通用框架。自推出以来，OpenAI、微软和谷歌等公司都采用了这一标准，将其AI模型与各种数据源整合。

当其他科技公司探索如何将该标准应用于其AI模型时，Ramaswami和他在谷歌的团队在今年早些时候开始研究如何使用该框架让数据共享平台更易访问。

谷歌还与ONE Campaign合作推出了ONE数据智能体，这是一个专注于改善非洲经济机会和公共卫生的非营利组织。这个AI工具利用MCP服务器以简明语言呈现数千万个金融和健康数据点。

ONE Campaign向谷歌数据共享团队提出了在其自定义服务器上实现MCP的原型。Ramaswami告诉TechCrunch，这次互动是促使团队在5月构建专用MCP服务器的转折点。

然而，这种体验并不局限于ONE Campaign。数据共享MCP服务器的开放性使其与任何大语言模型兼容，谷歌为开发者提供了多种入门方式。通过智能体开发工具包(ADK)在Colab笔记本中提供了示例智能体，服务器也可以通过Gemini CLI或使用PyPI包的任何MCP兼容客户端直接访问。GitHub存储库中还提供了示例代码。

Q&A

Q1：什么是谷歌数据共享MCP服务器？

A：谷歌数据共享MCP服务器是基于模型上下文协议的服务器，它能让开发者、数据科学家和AI智能体通过自然语言访问真实世界的统计数据，包括政府调查、联合国等机构的公共数据集。

Q2：MCP服务器如何解决AI训练中的幻觉问题？

A：AI系统常用嘈杂、未验证的网络数据训练，容易产生幻觉。MCP服务器通过提供高质量、可验证的真实世界数据，让AI建立在准确的结构化信息基础上，从而减少幻觉现象。

Q3：开发者如何使用谷歌数据共享MCP服务器？

A：开发者可以通过多种方式使用，包括在Colab笔记本中使用智能体开发工具包的示例智能体，通过Gemini CLI直接访问，或使用PyPI包的任何MCP兼容客户端，GitHub上还提供了示例代码。

来源：Techcrunch

0赞

好文章，需要你的鼓励

谷歌让AI更易获取真实世界数据

来源：Techcrunch

2025

09/25

10:48

分享

点赞

亚马逊推出Alexa网页版：生成式AI助手的新选择

Plaud推出可穿戴AI记录设备NotePin S，CES 2026记者新利器

机器人初创公司推出现实版瓦力机器人及其他伴侣产品

VisIC宣布完成2,600万美元B轮融资

CES 2026 | AMD扩张“边缘统治力” “芯片级异构”塑造汽车、工业边缘应用“新法则”

CES 2026 | NVIDIA新风向: Rubin平台面市 ，系统级“AI工厂”成型，物理AI加速落地

英伟达Vera-Rubin平台推出前六月已淘汰现有AI硬件

英特尔推出首批18A工艺制程的Core Ultra处理器

Rokid在CES 2026推出无屏AI智能眼镜

英伟达物理AI模型为新一代机器人铺路

微软发布 GitHub Copilot 的 C++ 代码编辑工具

至顶AI实验室硬核评测：戴尔Precision 5690移动工作站，部署DeepSeek+LobeChat打造个人超级智能体

微软为Copilot引入Anthropic AI模型

苹果推出SimpleFold：轻量级蛋白质折叠预测AI模型

Modular获2.5亿美元融资，简化AI硬件部署

Google推出数据公地MCP服务器，为AI智能体提供可信数据支撑

英国250强企业高管呼吁电网升级以支持AI数据中心扩张

美光科技在AI驱动DRAM浪潮中创下收入记录

Creatio推出"自带模型"功能，让企业自主选择AI模型

阿里巴巴云平台将集成英伟达物理AI开发工具

Salesforce从AI模型转向智能体AI战略转型

MemVerge推出开源AI内存层助力大语言模型发展

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

CES 2026 | NVIDIA新风向: Rubin平台面市，系统级“AI工厂”成型，物理AI加速落地