Databricks 今天启动了"代理周"活动,推出了新的和增强的产品,旨在帮助企业更有信心地部署和扩展人工智能代理。
AI 代理是能够感知环境、做出决策并采取行动以实现特定目标的自主或半自主程序,可以有人类监督也可以完全自主。尽管大多数企业现在都在使用 AI,但由于担心无法追踪或控制代理的行为,许多企业不愿在关键业务或面向客户的场景中部署代理。
Databricks 表示,为了应对这一问题,该公司扩展了其 Mosaic AI Gateway 的功能。这个网关可以帮助企业管理和治理他们的 AI 模型和部署,现在可以支持广泛的开源和商业大语言模型。该软件目前处于公开预览阶段。
目前处于公开预览阶段的 AI/BI Genie Conversation API 套件,使开发者能够将自然语言聊天机器人嵌入到定制应用程序或流行的生产力工具中,如 Microsoft 的 Teams 和 Sharepoint 以及 Salesforce 的 Slack。
Databricks 的 AI 副总裁 Naveen Rao 表示:"人们非常喜欢 Genie 界面,因此他们要求能够将其嵌入到自己的应用程序中。这是一种特殊的代理,允许您在商业智能环境中与数据进行交互。"
Rao 表示,该功能面向需要运行复杂查询但不精通结构化查询语言的商业用户。该代理可以嵌入到任何能够接收应用程序编程接口的应用程序中。他说:"只要设置好权限,您就可以为任何类型的应用程序添加界面。您甚至可以制作在浏览器中运行的 JavaScript 应用程序。"
Genie 无需训练,因为它可以处理表格中已有的元数据,如列标题。例如,它能理解标记为"成本"的列可能指的是金钱,并会在财务查询中包含这些数据。
目前处于公开预览阶段的升级版 Agent Evaluation Review App 让领域专家能够更轻松地提供有针对性的反馈、发送用于标记的追踪信息,并自定义评估标准。
Rao 说:"评估定制模型是客户的一大痛点。构建评估相当困难。您需要有足够的覆盖范围来涵盖所有案例,并且需要足够的深度来充分探测系统。"
他表示,虽然 Graduate-Level Google-Proof Q&A 和 Natural Language Understanding Evaluation REST API Reference 等公共评估框架很有用,但并不总能为特定用例提供所需的深度。Rao 说:"我们让以问答形式定义评估变得非常简单,同时还可以描述任务本身。"
今天同样进入公开预览的还有 Provision-Less Batch Inference,这是一种使用单个 SQL 查询通过 Mosaic AI 运行批量推理的新方法。Rao 表示,它消除了用户配置基础设施的需求,这个功能在对大型数据集进行查询时特别有用。
他说:"对 1000 万行的查询需要比对 5 行的查询更多的基础设施。这个功能会自动计算请求的大小,启动所有必要的计算资源,并以批处理模式运行请求以最小化成本。您完全不需要考虑配置或扩展问题。"
今天的公告是 Databricks 计划在本周内发布的多个代理相关介绍中的第一个。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。