谷歌正在将其庞大的公共数据宝库转化为AI的金矿,推出了数据共享模型上下文协议(MCP)服务器,使开发者、数据科学家和AI智能体能够通过自然语言访问真实世界的统计数据,从而更好地训练AI系统。
谷歌数据共享平台于2018年推出,整合了来自政府调查、地方行政数据以及联合国等全球机构统计数据等各种来源的公共数据集。随着MCP服务器的发布,这些数据现在可以通过自然语言访问,让开发者能够将其集成到AI智能体或应用程序中。
AI系统通常使用嘈杂、未经验证的网络数据进行训练。再加上它们在缺乏来源时"填补空白"的倾向,这会导致产生幻觉。因此,希望针对特定用例对AI系统进行微调的公司往往需要获取大量高质量数据集。通过公开发布数据共享的MCP服务器,谷歌旨在解决这两个挑战。
数据共享的新MCP服务器连接了从人口普查数据到气候统计等公共数据集与日益依赖准确结构化上下文的AI系统。通过使这些数据可以通过自然语言提示访问,此次发布旨在让AI建立在可验证的真实世界信息基础上。
"模型上下文协议让我们能够利用大语言模型的智能,在正确的时间选择正确的数据,而无需了解我们如何建模数据或API如何工作,"谷歌数据共享负责人Prem Ramaswami在采访中表示。
MCP最初由Anthropic于去年11月推出,是一个开放的行业标准,使AI系统能够从各种来源访问数据,包括商业工具、内容存储库和应用开发环境,为理解上下文提示提供了通用框架。自推出以来,OpenAI、微软和谷歌等公司都采用了这一标准,将其AI模型与各种数据源整合。
当其他科技公司探索如何将该标准应用于其AI模型时,Ramaswami和他在谷歌的团队在今年早些时候开始研究如何使用该框架让数据共享平台更易访问。
谷歌还与ONE Campaign合作推出了ONE数据智能体,这是一个专注于改善非洲经济机会和公共卫生的非营利组织。这个AI工具利用MCP服务器以简明语言呈现数千万个金融和健康数据点。
ONE Campaign向谷歌数据共享团队提出了在其自定义服务器上实现MCP的原型。Ramaswami告诉TechCrunch,这次互动是促使团队在5月构建专用MCP服务器的转折点。
然而,这种体验并不局限于ONE Campaign。数据共享MCP服务器的开放性使其与任何大语言模型兼容,谷歌为开发者提供了多种入门方式。通过智能体开发工具包(ADK)在Colab笔记本中提供了示例智能体,服务器也可以通过Gemini CLI或使用PyPI包的任何MCP兼容客户端直接访问。GitHub存储库中还提供了示例代码。
Q&A
Q1:什么是谷歌数据共享MCP服务器?
A:谷歌数据共享MCP服务器是基于模型上下文协议的服务器,它能让开发者、数据科学家和AI智能体通过自然语言访问真实世界的统计数据,包括政府调查、联合国等机构的公共数据集。
Q2:MCP服务器如何解决AI训练中的幻觉问题?
A:AI系统常用嘈杂、未验证的网络数据训练,容易产生幻觉。MCP服务器通过提供高质量、可验证的真实世界数据,让AI建立在准确的结构化信息基础上,从而减少幻觉现象。
Q3:开发者如何使用谷歌数据共享MCP服务器?
A:开发者可以通过多种方式使用,包括在Colab笔记本中使用智能体开发工具包的示例智能体,通过Gemini CLI直接访问,或使用PyPI包的任何MCP兼容客户端,GitHub上还提供了示例代码。
好文章,需要你的鼓励
亚马逊在CES期间宣布推出Alexa.com网站,用户可像使用其他AI聊天机器人一样与Alexa交互。经过数月早期体验,Alexa+已获得数千万用户。新网站支持语音和文本交互,需登录使用以确保跨设备功能连续性。76%的Alexa+交互为独特任务,包括智能家居控制和第三方集成。Alexa+兼容七年来的设备,正式版将收费每月20美元或包含在Prime会员中。
SimWorld是由UCSD等多所顶尖院校联合开发的革命性AI仿真平台,基于虚幻引擎5构建了具备真实物理规律的虚拟城市环境。该平台支持无限扩展的程序化世界生成和自然语言交互,让AI智能体能够在复杂环境中学会生存、合作和竞争,为通用人工智能的发展提供了前所未有的训练平台。
AI笔记公司Plaud在CES 2026推出新款可穿戴设备NotePin S,可夹在衣领、戴在手腕或挂在脖子上记录对话。该设备通过蓝牙连接手机,配备双麦克风,录制范围约3米,支持一键高亮标记重要时刻。同时发布的还有Plaud Desktop桌面AI记录工具,可原生捕获线上会议内容,无需机器人加入通话。两款产品将所有笔记、会议和对话整合到统一平台管理。
浙江大学联合华为提出C2DLM,这是一种因果概念引导的扩散语言模型,通过自动提取因果关系并融入注意力机制来增强AI推理能力。相比传统方法,C2DLM在推理任务上平均提升1.31%-12%,训练效率提高3.2倍,为解决语言模型推理能力不足开辟了新路径。