Databricks扩展AI智能体治理与评估工具

Databricks今日宣布对其Agent Bricks框架进行一系列更新，旨在提升企业AI代理的治理、准确性和模型灵活性。更新内容包括MLflow开源平台的新功能、模型上下文协议服务器市场以及文档结构化数据提取工具。公司表示，这些更新旨在帮助企业将AI代理从试点项目推向生产环境，同时保持对数据访问、模型使用和决策准确性的控制。

Databricks公司今天宣布对其Agent Bricks框架进行一系列更新，旨在提升企业AI智能体的治理、准确性和模型灵活性。

这些公告是其"AI智能体周"的一部分，包括在MLflow开源平台中用于管理机器学习生命周期的新功能、模型上下文协议服务器市场以及从文档中提取结构化数据的工具。

Databricks表示，这些更新旨在帮助企业将AI智能体从试点项目转向生产环境，同时保持对数据访问、模型使用和决策准确性的控制。

此前专注于机器学习的MLflow平台现在将支持AI智能体的评估和监控。Databricks AI和机器学习产品高级总监Craig Wiley表示："我们将大量评估能力开源到MLflow中。"

评估框架对于希望部署智能体的组织至关重要，特别是在面向外部的环境中。AI模型评估确保智能体可靠、准确且值得信赖，还可能涵盖公平性、偏见和稳健性等因素。

可调节评估

更新后的框架允许用户创建自定义评估逻辑，包括使用特定领域标准评估模型性能的可调节"评判器"。Wiley说："你可以提供自然语言反馈，我们会在后台训练评判器以更好地反映这种反馈。"

用户还可以导入或创建自己的评判器，或使用Databricks提供的开源版本。评判器可以评估测试集和实时生产推理。

Databricks还推出了AI Gateway，这是一个标准化模型访问和监控方式的治理层。该网关可应用于OpenAI的GPT-5、谷歌的Gemini和Anthropic的Claude等专有模型，以及Llama和GPT-OSS等开源模型。

Wiley说："Databricks上的任何大语言模型端点都可以使用AI Gateway进行治理。如果客户给我们一个端点，我们会将治理原生模型的相同标准应用到该端点。"

治理功能包括日志记录、访问控制、速率限制和审计跟踪，通过Databricks的Unity Catalog执行。可以设置控制来限制使用以达到成本控制目的。

MCP市场

对模型控制协议的支持允许AI智能体与第三方数据和服务安全交互，例如从You.com检索上下文或使用Glean Technologies的搜索引擎分析客户数据。

例如，Wiley说："You.com提供了最好的互联网索引之一。他们可以让智能体使用该索引，但继续拥有他们期望从Databricks获得的治理、访问控制、监控和日志记录。"Wiley表示，Databricks打算让客户需求驱动市场中MCP服务器的选择。

他说："如果有人具备我们客户需要的功能，我们很乐意找到使其可用的方法。"虽然合作伙伴在市场中列出产品没有费用，但"客户调用某些MCP服务器是有成本的"。

目前处于测试阶段的多智能体监督功能可以协调多个智能体和MCP服务器的工作流程。Databricks表示，这允许智能体采取自动化操作，如创建支持工单或运行SQL查询，同时通过Unity Catalog维持治理。

强化版OCR

为了帮助智能体访问文档中锁定的知识，Databricks还推出了ai_parse_document，这是一个从PDF和表格中提取结构化数据的SQL函数。作为一种强化版光学字符识别引擎，该函数将非结构化内容转换为Unity Catalog中的受治理、可搜索数据。

Wiley说："它不仅识别或翻译文本，还将文档分块以便在向量数据库中使用"，从而能够用于检索增强生成和其他智能体工作流程。客户可以使用Databricks的信息提取模块提取、细化和标记信息，该模块可以识别合同条款或个人标识符等实体。

Wiley表示，Databricks专注于帮助组织在高风险应用中部署AI智能体，在这些应用中治理和评估至关重要。他说："我们的目标是帮助组织将这些智能体应用到风险和高价值用例中。"

新功能从今天开始提供，部分功能处于测试版或公开预览阶段。

Q&A

Q1：Databricks的AI Gateway是什么？它有什么作用？

A：AI Gateway是Databricks推出的治理层，用于标准化模型的访问和监控方式。它可以应用于OpenAI的GPT-5、谷歌的Gemini等专有模型，以及开源模型。治理功能包括日志记录、访问控制、速率限制和审计跟踪。

Q2：MLflow平台现在支持哪些新功能？

A：MLflow平台现在支持AI智能体的评估和监控。更新后的框架允许用户创建自定义评估逻辑，包括可调节的"评判器"来评估模型性能。用户可以提供自然语言反馈，系统会训练评判器更好地反映这种反馈。

Q3：ai_parse_document函数能做什么？

A：ai_parse_document是一个SQL函数，可以从PDF和表格中提取结构化数据。它不仅能识别和翻译文本，还能将文档分块以便在向量数据库中使用，支持检索增强生成和其他智能体工作流程。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Databricks扩展AI智能体治理与评估工具

来源：SiliconANGLE

2025

11/04

08:39

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

Sora 2应用向美国等地用户全面开放，无需邀请码

Perplexity与Getty Images签署多年许可协议，应对版权争议

AWS业绩超华尔街预期，云基础设施需求持续旺盛

德州核电数据中心合作项目启动，计划2031年投产

高通骁龙X Elite和X Plus笔记本芯片详解

亚马逊股价大涨，AWS云业务增长加速

Microsoft 365 商业客户无处躲避 Copilot 功能扩张

Google Chrome推出AI操作按钮对抗AI浏览器

美国能源部联手Nvidia、AMD与Oracle打造四台强大AI超级计算机

面向未来的AI芯片技术发展之路

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: