如何通过markdown调整将Claude输出成本减半

数据分析师Drona Reddy在GitHub发布了一个名为Claude.md的标记文件，声称可将Claude输出标记使用量减少约63%。该文件通过结构化指令对模型施加行为约束，包括限制输出长度、强调标记效率、控制推测性内容等，消除不必要的客套话和冗余表达。Reddy测试显示，在高频使用场景下可实现显著成本节约，但在低使用量情况下可能得不偿失。分析师认为这对企业有一定价值，但节约效果可能比预期更温和。

在GitHub一个更多用于周末实验而非范式转换的安静角落，曾在亚马逊美国工作过的数据分析师Drona Reddy发布了一个markdown文件，承诺能将Claude的输出Token使用量减少一半以上，不是通过修改代码，而是通过重塑模型行为。

这个名为Claude.md的文件采用MIT许可证，概述了一套结构化指令，声称无需任何代码修改即可将Claude的输出冗长度减少约63%。

这些指令对模型施加了严格的行为约束，包括输出长度限制、强调Token效率和准确性、投机控制、排版规则，以及对阿谀奉承回复的零容忍政策。它们还简化了代码生成并定义了明确的覆盖策略，有效训练模型以更简洁和慎重的方式回应。

核心理念很直接：消除Reddy所描述的Claude的"轻浮"习惯，剔除一切非严格必要的内容。这意味着不再有自动客套话如"当然！"或"好问题！"，不再有样板结束语如"希望这能帮到你"，不再重述提示，不再提供多余建议或过度工程化的抽象。

同时也控制了风格癖好，如"em"破折号、智能引号和其他可能破坏解析器的Unicode字符，同时防止模型反射性地同意有缺陷的假设。

据Reddy称，这种严格性在规模化应用时可能转化为有意义的节省，将小的风格调整转换为超额的效率收益。

这位数据分析师还概述了markdown文件可能最有效的三个不同用例。首先是高容量自动化管道，如简历机器人、智能体循环和代码生成，其中冗长性在重复调用中累积。其次是重复的结构化任务，Claude的默认扩展性在数百次交互中会累积。第三是需要跨会话一致、可解析输出格式的团队环境，更严格的响应控制提高了可靠性和下游可用性。

在Claude Sonnet上的自己模拟中，Reddy表示该文件在100次提示下每天可节省近9600个Token，相当于每月约0.86美元的节省。在每天1000次提示时，节省量上升至约96000个Token，即每月8.64美元，而在三个项目的组合中，他估计减少了近288000个Token，相当于每月约25.92美元。

然而，这位数据分析师也警告说，在某些用例中，该文件可能真的无效，甚至适得其反，比如单次一次性查询、修复深度故障或需要反馈的探索性工作，因为该文件本身在每条消息上都消耗输入Token。

"CLAUDE.md文件本身在每条消息上都消耗输入Token。节省来自减少的输出Token。只有当输出量足够高以抵消持续的输入成本时，净值才是正的。在低使用量时，成本比节省的更多，"Reddy在仓库文档中写道。

分析师确实看到企业及其CIO从markdown文件中获益，至少在某种程度上如此，特别是他们努力平衡螺旋式上升的推理费用并将智能体或其他AI试点投入生产时。

"63%的Token减少可以有意义地降低运行大容量Claude工作负载的企业的推理成本和延迟，"Forrester首席分析师Charlie Dai说。

然而，收益可能更多是操作性的而非变革性的。

"对于CIO来说，这种方法提供了一些操作优势，因为它改善了输出一致性、改善了延迟并强制执行基本的Token纪律，这有助于扩展自动化，"Pareekh Consulting首席分析师Pareekh Jain说。

不过，Jain指出，虽然这是一个"有用的战术优化"，但并不根本改变企业AI经济学。

"在企业环境中，这种战术可能转化为更温和的节省，因为输出Token只是总使用量的一部分，输入上下文、检索和智能体编排通常主导成本，"Jain说。"因此，大多数企业可能看到个位数的节省而非标题数字，"他补充道。

该markdown文件设计为模型无关，应该适用于能够遵循结构化指令的大语言模型，尽管Reddy指出他尚未测试其在本地模型(如运行在llama.cpp或Mistral上的模型)上的有效性。

Q&A

Q1：Claude.md是什么？它是如何工作的？

A：Claude.md是一个由数据分析师Drona Reddy发布的markdown文件，包含一套结构化指令，通过对Claude模型施加严格的行为约束来减少输出冗长度。它消除了不必要的客套话、样板结束语和风格癖好，训练模型以更简洁和慎重的方式回应，从而将输出Token使用量减少约63%。

Q2：使用Claude.md能节省多少成本？

A：根据Reddy的模拟，在100次提示下每天可节省近9600个Token，相当于每月约0.86美元。在每天1000次提示时，节省量上升至约96000个Token，即每月8.64美元。但需要注意的是，该文件本身消耗输入Token，只有当输出量足够高时才能实现净节省。

Q3：什么情况下不适合使用Claude.md？

A：Claude.md在某些用例中可能无效甚至适得其反，包括单次一次性查询、修复深度故障或需要反馈的探索性工作。因为该文件在每条消息上都消耗输入Token，在低使用量的情况下，成本可能比节省的还要多。

来源：InfoWorld

0赞

好文章，需要你的鼓励

如何通过markdown调整将Claude输出成本减半

来源：InfoWorld

2026

04/07

10:50

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

泄露曝光Anthropic新模型"Mythos"专攻网络安全应用

6G网络将如何彻底改变机器人技术的未来

Granola笔记应用默认公开分享存在隐私风险

AI模型最终训练成本仅占总成本一小部分

AI模型为保护同类而主动欺骗人类

OpenAI为Codex增加插件系统助力企业管控AI编程智能体

分析师警告：警惕夸大AI效益的新闻标题

AI时代的骨干网络：从训练超级公路到推理乡村道路

多险种保险是否更适合数据中心风险保障

阿联酋发布Falcon Perception，推进主权AI发展战略

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: