Databricks扩展AI智能体治理与评估工具

Databricks今日宣布对其Agent Bricks框架进行一系列更新，旨在提升企业AI代理的治理、准确性和模型灵活性。更新内容包括MLflow开源平台的新功能、模型上下文协议服务器市场以及文档结构化数据提取工具。公司表示，这些更新旨在帮助企业将AI代理从试点项目推向生产环境，同时保持对数据访问、模型使用和决策准确性的控制。

Databricks公司今天宣布对其Agent Bricks框架进行一系列更新，旨在提升企业AI智能体的治理、准确性和模型灵活性。

这些公告是其"AI智能体周"的一部分，包括在MLflow开源平台中用于管理机器学习生命周期的新功能、模型上下文协议服务器市场以及从文档中提取结构化数据的工具。

Databricks表示，这些更新旨在帮助企业将AI智能体从试点项目转向生产环境，同时保持对数据访问、模型使用和决策准确性的控制。

此前专注于机器学习的MLflow平台现在将支持AI智能体的评估和监控。Databricks AI和机器学习产品高级总监Craig Wiley表示："我们将大量评估能力开源到MLflow中。"

评估框架对于希望部署智能体的组织至关重要，特别是在面向外部的环境中。AI模型评估确保智能体可靠、准确且值得信赖，还可能涵盖公平性、偏见和稳健性等因素。

可调节评估

更新后的框架允许用户创建自定义评估逻辑，包括使用特定领域标准评估模型性能的可调节"评判器"。Wiley说："你可以提供自然语言反馈，我们会在后台训练评判器以更好地反映这种反馈。"

用户还可以导入或创建自己的评判器，或使用Databricks提供的开源版本。评判器可以评估测试集和实时生产推理。

Databricks还推出了AI Gateway，这是一个标准化模型访问和监控方式的治理层。该网关可应用于OpenAI的GPT-5、谷歌的Gemini和Anthropic的Claude等专有模型，以及Llama和GPT-OSS等开源模型。

Wiley说："Databricks上的任何大语言模型端点都可以使用AI Gateway进行治理。如果客户给我们一个端点，我们会将治理原生模型的相同标准应用到该端点。"

治理功能包括日志记录、访问控制、速率限制和审计跟踪，通过Databricks的Unity Catalog执行。可以设置控制来限制使用以达到成本控制目的。

MCP市场

对模型控制协议的支持允许AI智能体与第三方数据和服务安全交互，例如从You.com检索上下文或使用Glean Technologies的搜索引擎分析客户数据。

例如，Wiley说："You.com提供了最好的互联网索引之一。他们可以让智能体使用该索引，但继续拥有他们期望从Databricks获得的治理、访问控制、监控和日志记录。"Wiley表示，Databricks打算让客户需求驱动市场中MCP服务器的选择。

他说："如果有人具备我们客户需要的功能，我们很乐意找到使其可用的方法。"虽然合作伙伴在市场中列出产品没有费用，但"客户调用某些MCP服务器是有成本的"。

目前处于测试阶段的多智能体监督功能可以协调多个智能体和MCP服务器的工作流程。Databricks表示，这允许智能体采取自动化操作，如创建支持工单或运行SQL查询，同时通过Unity Catalog维持治理。

强化版OCR

为了帮助智能体访问文档中锁定的知识，Databricks还推出了ai_parse_document，这是一个从PDF和表格中提取结构化数据的SQL函数。作为一种强化版光学字符识别引擎，该函数将非结构化内容转换为Unity Catalog中的受治理、可搜索数据。

Wiley说："它不仅识别或翻译文本，还将文档分块以便在向量数据库中使用"，从而能够用于检索增强生成和其他智能体工作流程。客户可以使用Databricks的信息提取模块提取、细化和标记信息，该模块可以识别合同条款或个人标识符等实体。

Wiley表示，Databricks专注于帮助组织在高风险应用中部署AI智能体，在这些应用中治理和评估至关重要。他说："我们的目标是帮助组织将这些智能体应用到风险和高价值用例中。"

新功能从今天开始提供，部分功能处于测试版或公开预览阶段。

Q&A

Q1：Databricks的AI Gateway是什么？它有什么作用？

A：AI Gateway是Databricks推出的治理层，用于标准化模型的访问和监控方式。它可以应用于OpenAI的GPT-5、谷歌的Gemini等专有模型，以及开源模型。治理功能包括日志记录、访问控制、速率限制和审计跟踪。

Q2：MLflow平台现在支持哪些新功能？

A：MLflow平台现在支持AI智能体的评估和监控。更新后的框架允许用户创建自定义评估逻辑，包括可调节的"评判器"来评估模型性能。用户可以提供自然语言反馈，系统会训练评判器更好地反映这种反馈。

Q3：ai_parse_document函数能做什么？

A：ai_parse_document是一个SQL函数，可以从PDF和表格中提取结构化数据。它不仅能识别和翻译文本，还能将文档分块以便在向量数据库中使用，支持检索增强生成和其他智能体工作流程。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Databricks扩展AI智能体治理与评估工具

来源：SiliconANGLE

2025

11/04

08:39

分享

点赞

除英伟达和台积电外，其他AI公司都需要靠量补利

2025年数据中心芯片领域最热门发展趋势

自动化技术领导者揭示企业对AI认知的关键误区

五分之三企业对Wi-Fi投资信心增强

CIO部署新兴技术指南：Gartner三步法平衡风险与收益

埃森哲与Anthropic合作引领AI集成商崛起之路

Pure Storage和华为存储增长最快，IDC第三季度报告显示

英特尔或以16亿美元收购AI推理芯片初创公司SambaNova

5D记忆晶体将成为未来数据存储主流技术

首届全国独角兽企业大赛总决赛在甬顺利闭幕

为全天候绿电而生，海辰储能发布全球首个原生8小时长时储能解决方案

为AI+而生，海辰储能发布全球首款锂钠协同AIDC全时长储能解决方案

Sora 2应用向美国等地用户全面开放，无需邀请码

Perplexity与Getty Images签署多年许可协议，应对版权争议

AWS业绩超华尔街预期，云基础设施需求持续旺盛

德州核电数据中心合作项目启动，计划2031年投产

高通骁龙X Elite和X Plus笔记本芯片详解

亚马逊股价大涨，AWS云业务增长加速

Microsoft 365 商业客户无处躲避 Copilot 功能扩张

Google Chrome推出AI操作按钮对抗AI浏览器

美国能源部联手Nvidia、AMD与Oracle打造四台强大AI超级计算机

面向未来的AI芯片技术发展之路

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: