Salesforce公司正致力于将对话交互打造成开发者的核心工作界面,推出平台"无头"版本,让人类与AI能够在几乎任何环境中进行构建开发。
这一新能力被命名为Headless 360,将为公司带来全新的开发范式。
Salesforce平台中的所有功能均可通过应用程序编程接口(API)、用于连接模型与数据工具的模型上下文协议(MCP)工具,以及命令行方式访问。这意味着人类和AI模型都能在其上进行开发,并以更少的限制跨平台组合应用。
据Salesforce介绍,这一变化开启了全新的可能性空间。开发者可以将任意厂商的编程智能体引入工作流,包括Claude Code、Cursor、Codex和Windsurf。
AI还带来了另一种可能:开发者可以在Slack、移动端、ChatGPT、Claude、Gemini、Teams或任何支持MCP的客户端等聊天界面中,通过输入提示词来激发创意和生成代码。
借助Agentforce让智能体焕发活力
为支持上述可能性,Salesforce推出了全新的智能体构建方式——Agentforce Vibe 2.0。这是一款AI构建工具,原生集成于Salesforce平台,支持包括Claude Sonnet和GPT-5在内的多模型接入。它不仅能理解代码,更能理解业务逻辑,充当开发者的智能开发伙伴。
与此同时,开发者还将获得对用户界面的完整控制权,包括对React(一款用于构建用户界面的主流开源JavaScript库)的原生支持,从而能够从零构建快速、交互流畅且体验丰富的完全自定义应用。
Salesforce表示,某企业客户的Agentforce采用率在六周内从22%跃升至78%——智能体本身没有改变,改变的是用户体验。
除升级Vibe外,Salesforce还推出了Testing Center。该工具旨在发现逻辑漏洞、策略违规和不一致输出,在问题触达用户之前将其拦截。借助Custom Scoring Evals,开发者不仅能判断某一功能是否正常运行,还能量化其执行质量——通过设定一系列评估标准来衡量达标程度,而非仅依赖简单的通过/失败判定。
上线后,可观测性与会话追踪功能将让团队不仅能看到生产环境中发生了什么,还能了解背后的原因。Salesforce表示,当智能体出现偏离任务的情况时,团队可在数小时内而非数周内定位根本原因。A/B测试功能也同步推出,支持多个智能体版本同时在真实流量下运行,实现更具数据依据的测试与决策。
Agent Fabric扩展升级,加速多厂商AI协同
除智能体AI相关公告外,Salesforce还宣布对Agent Fabric进行重大扩展。Agent Fabric是该公司面向构建多厂商智能体网络的企业所提供的可信智能体控制平面。
升级后的Agent Fabric新增了自动化发现、智能体编写,以及面向大语言模型编排的集中治理能力。这使得任务交接、模型选择和决策制定均可在企业边界内完成,在不牺牲速度与质量的前提下优化成本与风险。
Salesforce指出,管控多厂商智能体集群的新范式,往往依赖于一个"主导"智能体来统筹整体工作流。实际操作中,这意味着由一个中心模型负责监督任务交接、协调多个子模型以保障可靠性与速度、管理成本与Token限额,并识别最优路径。
Salesforce表示,自2025年9月上线以来,Agent Fabric已为客户协调了数千个智能体实例,服务对象涵盖全球部分最大型企业,包括Capita plc,以及Alcon Inc.和Diabsolut Inc.等专业行业服务商。
Q&A
Q1:Headless 360是什么?它对开发者有什么用?
A:Headless 360是Salesforce推出的平台"无头"版本,旨在让开发者和AI能够在几乎任何环境中构建应用。它将平台中所有功能通过API、MCP工具和命令行对外开放,开发者可以从Slack、ChatGPT、Claude等任意支持MCP的客户端中访问和构建,大幅降低了跨平台开发的限制。
Q2:Agentforce Vibe 2.0相比之前有哪些升级?
A:Agentforce Vibe 2.0是一款原生集成于Salesforce平台的AI构建工具,新增了对Claude Sonnet和GPT-5的多模型支持,并加入了能理解业务逻辑的开发伙伴能力。此外还支持React原生集成,开发者可以从零构建完全自定义的用户界面。配套推出的Testing Center和Custom Scoring Evals工具,进一步帮助开发者在上线前发现问题并量化智能体性能。
Q3:Agent Fabric能解决什么问题?
A:Agent Fabric是Salesforce的多厂商智能体控制平面,解决的是企业在管理多个AI智能体时面临的协调难题。升级后的Agent Fabric支持自动化发现、智能体编写和大语言模型集中治理,能够在企业边界内完成任务交接、模型选择和决策制定,实现成本与风险的优化。自2025年9月上线以来,已为包括Capita plc在内的大型企业协调了数千个智能体实例。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。