数据湖供应商 Databricks 与 Palantir 签署合作协议,开发出了一种更好的大语言模型 (LLM) 微调方法,并在为期五年的战略联盟中将 Anthropic 的 Claude LLM 整合到其数据湖中。
Databricks 在 2023 年 6 月以 13 亿美元收购了生成式 AI 模型制造商 MosaicML,并将其技术发展成为 Mosaic AI。这是一套工具和服务,通过检索增强生成 (RAG) 技术应用于客户专有数据,帮助客户构建、部署和管理生成式 AI 模型。它已集成到 Databricks 的数据湖 —— 数据智能平台中。现在,该平台还整合了 Palantir 人工智能平台 (AIP),并通过它提供 Anthropic 的推理级 AI 模型。TAO (测试时自适应优化) 计划利用测试时计算来增强和简化模型调优,无需标注数据。
Databricks 联合创始人兼首席执行官 Ali Ghodsi 表示:"我们正将 Anthropic 模型的能力直接引入数据智能平台 —— 安全、高效且可扩展 —— 使企业能够构建适应其独特需求的领域特定 AI 代理。这就是企业 AI 的未来。"
Anthropic 联合创始人兼首席执行官 Dario Amodei 说:"今年,我们将看到能够独立处理复杂任务的 AI 代理取得显著进展。随着 Claude 现在在 Databricks 上可用,客户可以构建更强大的数据驱动代理,在这个 AI 新时代保持领先地位。"
Palantir 的 AIP 是一个工作流构建器,它使用生成式 AI 模型分析自然语言输入,生成可执行的响应,在军事场景中可以分析战场数据,提出策略和战术响应建议。早期的 Palantir AI 系统 Gotham 和 Foundry 是数据集成和分析系统,旨在帮助用户分析复杂的、不同的数据集并产生面向行动的响应,特别是在 Gotham 的军事和国家安全数据集方面。AIP 结合了 Palantir 的本体论 (Foundry) 框架,这是组织运营的数字表示,为其请求响应带来更多上下文。
Databricks 正将 Palantir 的军事级安全性引入其 Unity Catalog 和 Delta Sharing 功能。Unity Catalog 是 Databricks 平台内数据和 AI 的统一治理软件层。Delta Sharing 是 Databricks 共享第三方数据的方式。Databricks 表示,Databricks 和 Palantir 的共同客户将能够在安全、统一和可扩展的环境中使用生成式 AI、机器学习和数据仓库。
Databricks Federal 董事会主席 Rory Patterson 表示,Unity Catalog 和 Delta Sharing 与 Palantir 系统的结合"将为我们的共同客户带来两全其美的效果。"
与 Anthropic 的合作使 Databricks 能够通过 Databricks 数据智能平台原生提供 Anthropic 模型和服务,包括其最新的前沿模型 Claude 3.7 Sonnet,可通过 SQL 查询和模型端点使用。这意味着"客户可以构建和部署能够对自己数据进行推理的 AI 代理。" Claude 可以"处理具有大上下文窗口的大型、多样化数据集,以实现更好的定制化。"
Databricks 表示,其 Mosaic AI 提供了在客户自有数据上构建特定领域 AI 代理的工具,"在整个数据和 AI 生命周期中提供准确的结果和端到端治理,而 Anthropic 的 Claude 模型则针对客户最有用的实际任务进行优化。"
Unity Catalog 与 Anthropic Claude 协同工作,使用户能够实施访问控制、设置费用管理的速率限制、跟踪血统、实施安全防护、监控潜在滥用,并确保其 AI 系统在定义的道德边界内运行。客户可以通过自动生成向量索引或使用企业数据微调模型来定制 Claude 模型。
微调方面引出了 TAO 及其绕过标注数据需求的方式。在通用数据上训练的 LLM 可以通过使用配对的输入项和输出项(标签)进行额外训练来微调,清楚地指示所需响应。这通过将其内部预测与标签进行比较来调整其内部参数,从而"教导"模型生成更好的响应。例如,在天气相关会话中,输入可能是"雨是湿的吗?",答案是"是的。"
然而,这可能需要大量的人工标注工作,需要数万甚至数十万个输入-输出标签。Databricks 博客解释说,TAO 使用"测试时计算...和强化学习 (RL) 仅基于过去的输入示例来教导模型更好地完成任务,这意味着它随可调整的调优计算预算而扩展,而不是人工标注工作。"
该模型"然后直接以低推理成本执行任务(即不需要在推理时额外计算)。"出人意料的是,TAO 可以实现比传统微调更好的模型响应质量。据 Databricks 称,TAO 可以使 Llama 等低成本、开源的模型接近 GPT-4o、o3-mini 和 Claude 3.7 Sonnet 等专有模型的性能。
博客称:"在文档问答和 SQL 生成等专业企业任务上,TAO 的表现优于在数千个标注示例上的传统微调。它使 Llama 8B 和 70B 等高效开源模型在不需要标签的情况下达到与昂贵模型如 GPT-4o 和 o3-mini 相似的质量。" TAO 将使 Databricks 用户能够使用更经济且功能强大的生成式 AI 模型,并提高其能力。
要了解更多关于 Databricks 和 Anthropic 合作的信息,请注册参加即将举行的 Ghodsi 和 Amodei 网络研讨会。Anthropic 的 Claude 3.7 Sonnet 现已通过 AWS、Azure 和 Google Cloud 的 Databricks 平台提供。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。