智能体人工智能的未来——代表人类自主行动的智能系统——正逐渐成为现实,两家公司正在塑造其在企业内部的发展形态。IBM公司和Groq公司今天宣布建立战略合作伙伴关系,将IBM的watsonx Orchestrate企业级智能体编排和自动化平台与Groq的语言处理单元和GroqCloud推理基础设施相结合。
这一合作标志着AI基础设施和编排领域的关键转变。它将IBM的治理、混合互操作性和工作流编排与Groq的确定性、编译器驱动的速度相结合——使企业AI智能体能够在受监管的混合环境中以人类水平的响应速度执行任务。
IBM的战略:编排可信的智能体工作流
IBM的watsonx Orchestrate已悄然发展成为市场上最复杂的智能体AI平台之一。它允许非技术用户使用简单的英语指令构建和部署多智能体工作流——自动化HR、客户服务、财务和运营中的任务。
Orchestrate的突出之处在于其语义控制平面,它将目标分解为任务,协调多智能体协作,并在跨越本地部署、公有云和软件即服务系统的混合环境中执行。内置的AgentOps功能提供生命周期管理、可观察性和基于策略的治理,即使在关键任务部署中也能确保合规性和控制。
IBM领导者告诉我,他们的目标是使智能体应用变得可信、可审计和可组合,其基础植根于开源技术(通过Red Hat vLLM)并与watsonx堆栈(包括watsonx.data)集成。该平台的覆盖范围甚至扩展到IBM Z和LinuxONE,为银行、保险公司和政府使用的大型机带来智能体自动化。
"我们不仅仅是在自动化工作流——我们在编排智能,"一位IBM高管表示。"智能体AI意味着成千上万个专业AI智能体在企业级治理下协同工作。"
Groq的优势:确定性、简单性和速度
虽然IBM专注于编排,但Groq的差异化优势在于其确定性架构。其LPU不依赖GPU使用的复杂动态调度。相反,它使用编译器驱动的方法,提前预调度每个操作,消除运行时开销并实现时钟周期级别的可预测性。
这种确定性设计转化为高达10倍的推理性能提升和亚毫秒级响应时间。结合GroqCloud和GroqRack,企业现在可以部署不仅更快,而且更简单、更节能、更易管理的推理系统。
当我问Ross如何定义公司——芯片公司、系统公司还是其他什么时,他回答说:"我们尽量避免标签。我们提供Token即服务,但我们也销售硬件。"
Ross早在推理变得流行之前就一直在宣传推理的重要性。"我们从2016年就开始做推理,那时候推理还不流行,"他告诉我。"推理就是杀手级应用。"
今天,这种早期的信念得到了回报。Groq的LPU和编译器模型使其成为AI生态系统中增长最快的基础设施公司之一,企业和政府客户在医疗保健、交易和机器人等领域部署GroqCloud进行实时AI应用。
产品驱动增长和新的计算供应链
Ross的市场策略反映了Groq对其技术的信心。
"产品驱动增长,"他解释道。"我们的CMO喜欢说,杀死一个糟糕产品的最快方法是好的营销。如果你的产品无法经得起考验,营销会很快杀死它。我们有很好的产品,所以我们的目标是推出产品并让人们使用它。"
这种理念是有效的。Ross回忆的一次会议中,一位首席技术官印象深刻,立即转向他的同事说:"你今晚能开始基准测试吗?"回应是:"Groq是我的默认选择——我用它做所有事情。"
但速度不仅仅关于推理——也关于交付。在全球计算能力争夺战中,Groq正在突破困扰GPU供应商的积压问题。
"计算安全正变得与能源安全一样重要,"Ross说。"当你订购GPU时,可能需要24个月。黄仁勋甚至在GTC上说,如果你想要两年后的计算力,今天就签订采购订单。我们可以在大约六个月内交付,因为我们的供应链更简单。如果你想在AI方面赶上,你必须以月为单位思考,而不是年。"
为什么IBM-Groq合作伙伴关系重要
通过将Groq的确定性性能引入watsonx Orchestrate生态系统,IBM现在可以提供实时思考和行动的AI智能体。企业客户将能够在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化。
合作伙伴关系还扩展到将Red Hat vLLM与Groq的LPU堆栈集成——将开源推理编排与Groq的超快硬件层连接起来。这使开发人员更容易将现有的AI应用程序(包括检索增强生成和向量数据库工作负载)迁移到GroqCloud,只需最少的代码更改。
从更广阔的视角来看,这一合作统一了企业编排、开放混合架构和确定性计算——这三个支柱可能定义下一代AI基础设施。
"当企业投入生产时,他们必须确保复杂的工作流能够成功部署,"IBM软件高级副总裁兼首席商业官Rob Thomas说。"我们与Groq的合作伙伴关系强调了我们帮助客户从AI中实现业务价值的承诺——可靠地、大规模地。"
大局观:从实验到执行
IBM-Groq合作伙伴关系反映了整个行业从实验到执行的更广泛转变。AI不再仅仅关于模型训练——而是关于推理能够多快多可靠地进行,智能体系统如何协作,以及企业如何治理它们。
在这种背景下,IBM和Groq代表了同一个等式的两半:编排和速度,信任和性能,治理和确定性。
"推理是AI的心跳,"Ross告诉我。"如果你不能即时运行模型,你就无法让智能体智能地行动。确定性是使智能体系统可行的关键。"
随着AI智能体进入受监管行业,在毫秒级别内行动同时保持透明度和合规性的能力将成为决定性能力。IBM和Groq正在押注这种组合——智能体智能加上确定性速度——将开启企业AI的下一个时代。
Q&A
Q1:watsonx Orchestrate是什么?它有什么特殊功能?
A:watsonx Orchestrate是IBM开发的企业级智能体编排和自动化平台,允许非技术用户使用简单英语指令构建和部署多智能体工作流,自动化HR、客户服务、财务和运营任务。它具有语义控制平面,能够分解目标、协调多智能体协作,并在混合环境中执行。
Q2:Groq的LPU与传统GPU有什么区别?
A:Groq的LPU采用确定性架构,不依赖GPU的复杂动态调度,而是使用编译器驱动的方法提前预调度每个操作。这种设计消除了运行时开销,实现时钟周期级别的可预测性,提供高达10倍的推理性能提升和亚毫秒级响应时间。
Q3:IBM与Groq合作对企业AI发展有什么意义?
A:这一合作将IBM的企业编排能力与Groq的确定性高速计算相结合,使AI智能体能够实时思考和行动。企业可以在Orchestrate内直接访问GroqCloud推理,实现即时分析、决策和自动化,这标志着AI从实验阶段向实际执行阶段的重要转变。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。