简洁致胜：Chain of Draft 技术有望在提升性能的同时将 AI 成本削减 90%

Zoom Communications的研究团队开发了一种突破性技术，能够显著降低人工智能系统在处理复杂推理问题时所需的成本和计算资源，可能会改变企业大规模部署AI的方式。该方法称为草稿链（Chain of Draft，CoD），使大型语言模型能够用最少的文字解决问题——所需文本仅为当前方法的7.6%，同时保持或甚至提高准确性。研究结果上周在arXiv研究库中发表。

一支来自 Zoom Communications 的研究团队开发出了一项突破性技术，这项技术可能会大幅降低人工智能系统在处理复杂推理问题时所需的成本和计算资源，有望从根本上改变企业大规模部署 AI 的方式。

这种名为 Chain of Draft (CoD) 的方法使大语言模型能够用最少的文字来解决问题——仅使用当前方法所需文本量的 7.6%，同时保持或甚至提高准确性。这项研究成果已于上周发表在研究资料库 arXiv 上。

"通过减少冗长表述并专注于关键见解，CoD 在各种推理任务中仅使用 7.6% 的 token 就能达到或超越 CoT 的准确性，显著降低了成本和延迟，"由 Zoom 研究员 Silei Xu 领导的作者团队写道。

Chain of Draft (红色) 在四个推理任务中使用显著更少的 token 的同时，保持或超越了 Chain of Thought (黄色) 的准确性，展示了简洁的 AI 推理如何在不牺牲性能的情况下降低成本。(来源：arxiv.org)

如何通过"少即是多"在不牺牲准确性的情况下改变 AI 推理

Chain of Draft 的灵感来自人类解决复杂问题的方式。在解决数学问题或逻辑难题时，人们通常只会以简略的形式记下关键信息，而不是详细阐述每个细节。

研究人员在论文中解释道："在解决复杂任务时——无论是解决数学问题、写作还是编程——我们往往只记录能帮助我们取得进展的关键信息。通过模仿这种行为，大语言模型可以专注于推进解决方案，而不会产生冗长推理的开销。"

研究团队在多个基准测试中验证了他们的方法，包括算术推理 (GSM8k)、常识推理 (日期理解和体育理解) 以及符号推理 (硬币翻转任务)。

在一个涉及 Claude 3.5 Sonnet 处理体育相关问题的显著案例中，Chain of Draft 方法将平均输出从 189.4 个 token 减少到仅 14.3 个 token——减少了 92.4%——同时准确率从 93.2% 提高到 97.3%。

降低企业 AI 成本：简洁机器推理的商业价值

AI 研究员 Ajith Vallath Prabhakar 在分析该论文时指出："对于每月处理 100 万次推理查询的企业而言，CoD 可以将成本从 3,800 美元 (CoT) 降低到 760 美元，每月节省超过 3,000 美元。"

这项研究在企业 AI 部署的关键时期应运而生。随着企业increasingly将复杂的 AI 系统整合到运营中，计算成本和响应时间已成为广泛应用的重要障碍。

2022 年推出的 Chain-of-Thought (CoT) 等当前最先进的推理技术，通过将问题分解为逐步推理，大大提高了 AI 解决复杂问题的能力。但这种方法会生成冗长的解释，消耗大量计算资源并增加响应延迟。

Prabhakar 表示："CoT 提示的冗长特性导致了大量的计算开销、增加的延迟和更高的运营支出。"

实施 AI 效率：无需重新训练即可立即产生业务影响

对企业而言，Chain of Draft 的特别之处在于其实施的简单性。与许多需要昂贵的模型重训练或架构更改的 AI 进展不同，CoD 可以通过简单的提示修改立即在现有模型上部署。

Prabhakar 解释说："已经使用 CoT 的组织可以通过简单的提示修改切换到 CoD。"

这项技术对于对延迟敏感的应用尤其有价值，如实时客户支持、移动 AI、教育工具和金融服务，在这些领域即使很小的延迟也会显著影响用户体验。

行业专家认为，其影响不仅限于成本节省。通过使高级 AI 推理变得更容易获得和负担得起，Chain of Draft 可能会让较小的组织和资源受限的环境也能使用复杂的 AI 功能。

随着 AI 系统的不断发展，像 Chain of Draft 这样的技术凸显了效率与原始能力并重的趋势。对于在快速变化的 AI 领域中航行的企业来说，这些优化可能与底层模型本身的改进一样有价值。

"随着 AI 模型继续发展，优化推理效率将与提高其原始能力一样重要，"Prabhakar 总结道。

该研究的代码和数据已在 GitHub 上公开，允许组织在自己的 AI 系统中实施和测试这种方法。

来源：VentureBeat

0赞

好文章，需要你的鼓励

简洁致胜：Chain of Draft 技术有望在提升性能的同时将 AI 成本削减 90%

来源：VentureBeat

2025

03/04

15:47

分享

点赞

“4个9”韧性的背后，西云数据以技术与运营加速企业数字化创新

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: