智能体人工智能的未来——代表人类自主行动的智能系统——正逐渐成为现实,两家公司正在塑造其在企业内部的发展形态。IBM公司和Groq公司今天宣布建立战略合作伙伴关系,将IBM的watsonx Orchestrate企业级智能体编排和自动化平台与Groq的语言处理单元和GroqCloud推理基础设施相结合。
这一合作标志着AI基础设施和编排领域的关键转变。它将IBM的治理、混合互操作性和工作流编排与Groq的确定性、编译器驱动的速度相结合——使企业AI智能体能够在受监管的混合环境中以人类水平的响应速度执行任务。
IBM的战略:编排可信的智能体工作流
IBM的watsonx Orchestrate已悄然发展成为市场上最复杂的智能体AI平台之一。它允许非技术用户使用简单的英语指令构建和部署多智能体工作流——自动化HR、客户服务、财务和运营中的任务。
Orchestrate的突出之处在于其语义控制平面,它将目标分解为任务,协调多智能体协作,并在跨越本地部署、公有云和软件即服务系统的混合环境中执行。内置的AgentOps功能提供生命周期管理、可观察性和基于策略的治理,即使在关键任务部署中也能确保合规性和控制。
IBM领导者告诉我,他们的目标是使智能体应用变得可信、可审计和可组合,其基础植根于开源技术(通过Red Hat vLLM)并与watsonx堆栈(包括watsonx.data)集成。该平台的覆盖范围甚至扩展到IBM Z和LinuxONE,为银行、保险公司和政府使用的大型机带来智能体自动化。
"我们不仅仅是在自动化工作流——我们在编排智能,"一位IBM高管表示。"智能体AI意味着成千上万个专业AI智能体在企业级治理下协同工作。"
Groq的优势:确定性、简单性和速度
虽然IBM专注于编排,但Groq的差异化优势在于其确定性架构。其LPU不依赖GPU使用的复杂动态调度。相反,它使用编译器驱动的方法,提前预调度每个操作,消除运行时开销并实现时钟周期级别的可预测性。
这种确定性设计转化为高达10倍的推理性能提升和亚毫秒级响应时间。结合GroqCloud和GroqRack,企业现在可以部署不仅更快,而且更简单、更节能、更易管理的推理系统。
当我问Ross如何定义公司——芯片公司、系统公司还是其他什么时,他回答说:"我们尽量避免标签。我们提供Token即服务,但我们也销售硬件。"
Ross早在推理变得流行之前就一直在宣传推理的重要性。"我们从2016年就开始做推理,那时候推理还不流行,"他告诉我。"推理就是杀手级应用。"
今天,这种早期的信念得到了回报。Groq的LPU和编译器模型使其成为AI生态系统中增长最快的基础设施公司之一,企业和政府客户在医疗保健、交易和机器人等领域部署GroqCloud进行实时AI应用。
产品驱动增长和新的计算供应链
Ross的市场策略反映了Groq对其技术的信心。
"产品驱动增长,"他解释道。"我们的CMO喜欢说,杀死一个糟糕产品的最快方法是好的营销。如果你的产品无法经得起考验,营销会很快杀死它。我们有很好的产品,所以我们的目标是推出产品并让人们使用它。"
这种理念是有效的。Ross回忆的一次会议中,一位首席技术官印象深刻,立即转向他的同事说:"你今晚能开始基准测试吗?"回应是:"Groq是我的默认选择——我用它做所有事情。"
但速度不仅仅关于推理——也关于交付。在全球计算能力争夺战中,Groq正在突破困扰GPU供应商的积压问题。
"计算安全正变得与能源安全一样重要,"Ross说。"当你订购GPU时,可能需要24个月。黄仁勋甚至在GTC上说,如果你想要两年后的计算力,今天就签订采购订单。我们可以在大约六个月内交付,因为我们的供应链更简单。如果你想在AI方面赶上,你必须以月为单位思考,而不是年。"
为什么IBM-Groq合作伙伴关系重要
通过将Groq的确定性性能引入watsonx Orchestrate生态系统,IBM现在可以提供实时思考和行动的AI智能体。企业客户将能够在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化。
合作伙伴关系还扩展到将Red Hat vLLM与Groq的LPU堆栈集成——将开源推理编排与Groq的超快硬件层连接起来。这使开发人员更容易将现有的AI应用程序(包括检索增强生成和向量数据库工作负载)迁移到GroqCloud,只需最少的代码更改。
从更广阔的视角来看,这一合作统一了企业编排、开放混合架构和确定性计算——这三个支柱可能定义下一代AI基础设施。
"当企业投入生产时,他们必须确保复杂的工作流能够成功部署,"IBM软件高级副总裁兼首席商业官Rob Thomas说。"我们与Groq的合作伙伴关系强调了我们帮助客户从AI中实现业务价值的承诺——可靠地、大规模地。"
大局观:从实验到执行
IBM-Groq合作伙伴关系反映了整个行业从实验到执行的更广泛转变。AI不再仅仅关于模型训练——而是关于推理能够多快多可靠地进行,智能体系统如何协作,以及企业如何治理它们。
在这种背景下,IBM和Groq代表了同一个等式的两半:编排和速度,信任和性能,治理和确定性。
"推理是AI的心跳,"Ross告诉我。"如果你不能即时运行模型,你就无法让智能体智能地行动。确定性是使智能体系统可行的关键。"
随着AI智能体进入受监管行业,在毫秒级别内行动同时保持透明度和合规性的能力将成为决定性能力。IBM和Groq正在押注这种组合——智能体智能加上确定性速度——将开启企业AI的下一个时代。
Q&A
Q1:watsonx Orchestrate是什么?它有什么特殊功能?
A:watsonx Orchestrate是IBM开发的企业级智能体编排和自动化平台,允许非技术用户使用简单英语指令构建和部署多智能体工作流,自动化HR、客户服务、财务和运营任务。它具有语义控制平面,能够分解目标、协调多智能体协作,并在混合环境中执行。
Q2:Groq的LPU与传统GPU有什么区别?
A:Groq的LPU采用确定性架构,不依赖GPU的复杂动态调度,而是使用编译器驱动的方法提前预调度每个操作。这种设计消除了运行时开销,实现时钟周期级别的可预测性,提供高达10倍的推理性能提升和亚毫秒级响应时间。
Q3:IBM与Groq合作对企业AI发展有什么意义?
A:这一合作将IBM的企业编排能力与Groq的确定性高速计算相结合,使AI智能体能够实时思考和行动。企业可以在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化,这标志着AI从实验阶段向实际执行阶段的重要转变。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。