智能体人工智能的未来——代表人类自主行动的智能系统——正逐渐成为现实,两家公司正在塑造其在企业内部的发展形态。IBM公司和Groq公司今天宣布建立战略合作伙伴关系,将IBM的watsonx Orchestrate企业级智能体编排和自动化平台与Groq的语言处理单元和GroqCloud推理基础设施相结合。
这一合作标志着AI基础设施和编排领域的关键转变。它将IBM的治理、混合互操作性和工作流编排与Groq的确定性、编译器驱动的速度相结合——使企业AI智能体能够在受监管的混合环境中以人类水平的响应速度执行任务。
IBM的战略:编排可信的智能体工作流
IBM的watsonx Orchestrate已悄然发展成为市场上最复杂的智能体AI平台之一。它允许非技术用户使用简单的英语指令构建和部署多智能体工作流——自动化HR、客户服务、财务和运营中的任务。
Orchestrate的突出之处在于其语义控制平面,它将目标分解为任务,协调多智能体协作,并在跨越本地部署、公有云和软件即服务系统的混合环境中执行。内置的AgentOps功能提供生命周期管理、可观察性和基于策略的治理,即使在关键任务部署中也能确保合规性和控制。
IBM领导者告诉我,他们的目标是使智能体应用变得可信、可审计和可组合,其基础植根于开源技术(通过Red Hat vLLM)并与watsonx堆栈(包括watsonx.data)集成。该平台的覆盖范围甚至扩展到IBM Z和LinuxONE,为银行、保险公司和政府使用的大型机带来智能体自动化。
"我们不仅仅是在自动化工作流——我们在编排智能,"一位IBM高管表示。"智能体AI意味着成千上万个专业AI智能体在企业级治理下协同工作。"
Groq的优势:确定性、简单性和速度
虽然IBM专注于编排,但Groq的差异化优势在于其确定性架构。其LPU不依赖GPU使用的复杂动态调度。相反,它使用编译器驱动的方法,提前预调度每个操作,消除运行时开销并实现时钟周期级别的可预测性。
这种确定性设计转化为高达10倍的推理性能提升和亚毫秒级响应时间。结合GroqCloud和GroqRack,企业现在可以部署不仅更快,而且更简单、更节能、更易管理的推理系统。
当我问Ross如何定义公司——芯片公司、系统公司还是其他什么时,他回答说:"我们尽量避免标签。我们提供Token即服务,但我们也销售硬件。"
Ross早在推理变得流行之前就一直在宣传推理的重要性。"我们从2016年就开始做推理,那时候推理还不流行,"他告诉我。"推理就是杀手级应用。"
今天,这种早期的信念得到了回报。Groq的LPU和编译器模型使其成为AI生态系统中增长最快的基础设施公司之一,企业和政府客户在医疗保健、交易和机器人等领域部署GroqCloud进行实时AI应用。
产品驱动增长和新的计算供应链
Ross的市场策略反映了Groq对其技术的信心。
"产品驱动增长,"他解释道。"我们的CMO喜欢说,杀死一个糟糕产品的最快方法是好的营销。如果你的产品无法经得起考验,营销会很快杀死它。我们有很好的产品,所以我们的目标是推出产品并让人们使用它。"
这种理念是有效的。Ross回忆的一次会议中,一位首席技术官印象深刻,立即转向他的同事说:"你今晚能开始基准测试吗?"回应是:"Groq是我的默认选择——我用它做所有事情。"
但速度不仅仅关于推理——也关于交付。在全球计算能力争夺战中,Groq正在突破困扰GPU供应商的积压问题。
"计算安全正变得与能源安全一样重要,"Ross说。"当你订购GPU时,可能需要24个月。黄仁勋甚至在GTC上说,如果你想要两年后的计算力,今天就签订采购订单。我们可以在大约六个月内交付,因为我们的供应链更简单。如果你想在AI方面赶上,你必须以月为单位思考,而不是年。"
为什么IBM-Groq合作伙伴关系重要
通过将Groq的确定性性能引入watsonx Orchestrate生态系统,IBM现在可以提供实时思考和行动的AI智能体。企业客户将能够在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化。
合作伙伴关系还扩展到将Red Hat vLLM与Groq的LPU堆栈集成——将开源推理编排与Groq的超快硬件层连接起来。这使开发人员更容易将现有的AI应用程序(包括检索增强生成和向量数据库工作负载)迁移到GroqCloud,只需最少的代码更改。
从更广阔的视角来看,这一合作统一了企业编排、开放混合架构和确定性计算——这三个支柱可能定义下一代AI基础设施。
"当企业投入生产时,他们必须确保复杂的工作流能够成功部署,"IBM软件高级副总裁兼首席商业官Rob Thomas说。"我们与Groq的合作伙伴关系强调了我们帮助客户从AI中实现业务价值的承诺——可靠地、大规模地。"
大局观:从实验到执行
IBM-Groq合作伙伴关系反映了整个行业从实验到执行的更广泛转变。AI不再仅仅关于模型训练——而是关于推理能够多快多可靠地进行,智能体系统如何协作,以及企业如何治理它们。
在这种背景下,IBM和Groq代表了同一个等式的两半:编排和速度,信任和性能,治理和确定性。
"推理是AI的心跳,"Ross告诉我。"如果你不能即时运行模型,你就无法让智能体智能地行动。确定性是使智能体系统可行的关键。"
随着AI智能体进入受监管行业,在毫秒级别内行动同时保持透明度和合规性的能力将成为决定性能力。IBM和Groq正在押注这种组合——智能体智能加上确定性速度——将开启企业AI的下一个时代。
Q&A
Q1:watsonx Orchestrate是什么?它有什么特殊功能?
A:watsonx Orchestrate是IBM开发的企业级智能体编排和自动化平台,允许非技术用户使用简单英语指令构建和部署多智能体工作流,自动化HR、客户服务、财务和运营任务。它具有语义控制平面,能够分解目标、协调多智能体协作,并在混合环境中执行。
Q2:Groq的LPU与传统GPU有什么区别?
A:Groq的LPU采用确定性架构,不依赖GPU的复杂动态调度,而是使用编译器驱动的方法提前预调度每个操作。这种设计消除了运行时开销,实现时钟周期级别的可预测性,提供高达10倍的推理性能提升和亚毫秒级响应时间。
Q3:IBM与Groq合作对企业AI发展有什么意义?
A:这一合作将IBM的企业编排能力与Groq的确定性高速计算相结合,使AI智能体能够实时思考和行动。企业可以在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化,这标志着AI从实验阶段向实际执行阶段的重要转变。
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
微软研究院发布突破性多语言AI技术UPDESH,通过"自下而上"数据生成策略,让AI真正理解不同文化背景下的语言表达。该技术基于各语言维基百科内容生成950万个训练数据点,覆盖13种印度语言,显著提升低资源语言AI性能,为构建文化敏感型AI系统提供新路径。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
NVIDIA团队提出RLBFF方法,将AI训练中的复杂评价转化为明确的二元判断标准,解决了传统人类反馈模糊和可验证奖励局限的问题。该方法在多个权威测试中取得突破性成果,其中JudgeBench获得第一名,训练的模型性能媲美知名商业模型但成本仅为其5%,为AI训练领域带来重要方法论创新。