麻省理工与微软联合研发系统大幅提升AI智能体工作流效率

麻省理工学院与微软研究人员开发了一套名为Murakkab的智能系统,可自动优化AI智能体工作流的设计与部署。开发者只需用自然语言描述需求,系统便能自动选择最优模型与工具,并动态调整硬件配置和资源分配。测试显示,该系统仅需传统方法约35%的算力、27%的能耗和不足25%的成本,即可满足用户性能要求,为云服务提供商实现更高效的资源管理。

智能体工作流是由AI驱动的软件系统,通过将多个模型与外部工具串联起来,完成分析视频并回答相关问题等复杂任务。然而,这类高度碎片化系统在设计与部署方式上往往存在诸多低效问题,导致计算资源、能源和成本的浪费。

为提升效率,麻省理工学院与微软的研究人员共同开发了一套智能系统,能够简化智能体工作流的设计流程,并自动优化工作流的实施方式。

借助这套新方法,开发者只需用自然语言描述所需的智能体工作流功能,无需提前指定应用的所有技术细节。系统会自动选出最合适的模型与工具,并在工作流由云服务商执行时,确定最优的硬件配置与计算资源分配方案。系统还会根据每位用户的优先级(例如降低成本或提升速度)实时动态调整配置。

在多个智能体工作负载的测试中,与传统方案相比,这套新系统在不影响性能的前提下,显著减少了部署所需的计算单元数量,大幅降低了能耗与成本。

麻省理工学院电气工程与计算机科学系博士生、该系统论文的第一作者戈哈尔·乔杜里表示:"智能体工作流正变得越来越复杂,并迅速成为云服务商业务的核心支柱。能源消耗是一大突出问题,因此我们必须高度重视工作流的效率。资源过度分配的情况很容易发生,进而造成能源与资金的浪费。让云服务商能够智能化地优化这些工作流的资源使用,对所有相关方都是一件好事。"

论文合著者还包括麻省理工学院电气工程与计算机科学系副教授、计算机科学与人工智能实验室成员亚当·贝莱,以及通讯作者、微软Azure技术院士兼企业副总裁里卡多·比安基尼,以及微软Azure的其他研究人员。该论文将在USENIX操作系统设计与实现研讨会上正式发表。

配置难题

智能体工作流是由多个自主AI智能体协同运作的系统,这些智能体借助各类模型与工具(如数据库或Python程序),动态完成数据处理、代码生成等多步骤任务,并作为后台支撑流程驱动面向用户的应用程序运行。

通常,开发者需要在开发阶段就将所有技术选择硬编码进系统,包括明确使用哪些AI智能体、模型和工具,以及它们的调用顺序,同时还需指定运行工作流的硬件,并在速度与成本之间进行权衡取舍。

这一过程尤为困难,因为智能体工作流需要整合多个"黑盒"模型和各类工具,每个组件都有各自的配置选项,且可能来自不同的厂商。一旦有新的AI模型发布,能够提升应用的精度或效率,开发者就不得不从头开始重新实现。

乔杜里表示:"即便你想手动完成这一切,也很难将工作流配置到最优状态,因为可能的配置空间实在太大了。"

此外,为用户部署应用的云数据中心无法洞察工作流内部情况,难以在用户发出请求时以最高效的方式分配硬件资源。

为此,研究团队开发了这套名为Murakkab的新系统(该名称来自乌尔都语,意为"多种事物的组合"),旨在对整个智能体工作流流程进行全面优化。

动态决策机制

Murakkab首先允许开发者以高层次的意图描述来创建智能体工作流,而无需逐一说明各组件的具体组合方式。例如,开发者可以描述一个视频问答应用:提取关键帧、生成文字记录,然后回答用户关于视频内容的问题。

"实现这一目标的方式有很多,而不同的模型和工具组合会直接影响应用完成任务的速度。"乔杜里说道。

Murakkab接收开发者的简洁描述后,会自动识别并整合现有的最优模型与工具来构建工作流,同时判断哪些组件需要顺序执行、哪些可以并行运行,以提升整体性能。

"该平台会随着时间推移动态做出配置决策。即便明天出现了新的模型或GPU加速器,开发者也无需为此操心。"他说。

当云服务商为用户部署应用时,Murakkab会根据用户的约束条件(例如在满足延迟要求的同时优先保证精度)对工作流进行优化配置。系统实时自适应地确定最优硬件分配方案和部署计划,以最大化效率,并生成可供云服务商直接执行的工作流。

"我们的系统还为云服务商提供了对多个工作负载的全局可见性,使其能够以最高效的方式共享计算资源,同时满足各用户的约束条件。"他补充道。

在视频问答和代码生成等多类智能体工作流的测试中,Murakkab在满足用户需求的同时,仅需其他方案约35%的计算量,能耗约为后者的27%,成本不足后者的25%。

Murakkab的动态特性还支持用户灵活权衡各项指标。在一个测试案例中,系统将某智能体工作流的能耗降低了十倍以上,而精度损失仅约2%。

此外,系统还为一个负责选取视频帧的模型发现了一种出乎意料的最优配置,显著提升了视频问答任务的性能。乔杜里表示,这类优化几乎是开发者手动操作无法实现的。

下一步,研究团队计划将系统扩展至更复杂的工作流和更大规模的计算集群,同时探索在新型智能体应用中的优化机会。

"让这些工作流在资源使用上更加高效、大幅降低能耗,具有巨大的潜力。但我们需要在主流云平台的规模上系统性地思考这个问题。"乔杜里说道。

本研究得到了半导体研究公司及美国国防高级研究计划局的部分资助。

Q&A

Q1:Murakkab系统是什么?它主要解决什么问题?

A:Murakkab是由麻省理工学院与微软联合研发的智能系统,名称来自乌尔都语,意为"多种事物的组合"。它主要解决AI智能体工作流在设计和部署过程中存在的资源浪费问题。传统方式需要开发者手动硬编码所有技术配置,而Murakkab允许开发者用自然语言描述需求,由系统自动选择最优模型、工具及硬件配置,从而大幅减少计算资源消耗、降低能耗与成本。

Q2:Murakkab系统的实际测试效果如何?

A:在视频问答和代码生成等多类智能体工作流测试中,Murakkab表现出色。与传统方案相比,它仅需约35%的计算量、约27%的能耗,以及不足25%的成本,同时不影响整体性能。在一个具体案例中,系统将工作流能耗降低了十倍以上,而精度损失仅约2%。此外,它还能自动发现开发者手动操作难以实现的最优配置方案。

Q3:Murakkab系统如何帮助云服务商提升资源利用效率?

A:Murakkab为云服务商提供了对多个工作负载的全局可见性,使其能够实时了解各智能体工作流的资源需求。系统会根据用户设定的优先级(如速度、成本或精度)自适应地分配硬件资源和制定部署计划,避免资源过度分配的浪费现象。这种智能化的资源共享机制,使云服务商能够在满足用户约束条件的同时,实现整体计算资源的最优利用。

来源:MIT News

0赞

好文章,需要你的鼓励

2026

07/02

15:34

分享

点赞

邮件订阅