Brad Menezes,企业型 vibe 编码初创公司 Superblocks 的 CEO,认为下一代价值数十亿美元的初创企业创意几乎就隐藏在眼前:现有独角兽级 AI 初创企业使用的系统提示。
系统提示是 AI 初创企业用来指导像 OpenAI 或 Anthropic 这样的公司的基础模型如何生成它们的应用级 AI 产品的冗长提示文字(超过 5,000-6,000 个字)。在 Menezes 看来,它们就好比是 prompt 工程的高级课程。
“每个公司对于同一个 [基础] 模型都有完全不同的系统提示,”他在接受 TechCrunch 采访时说道。“他们试图让模型正好完成某个特定领域、特定任务所要求的操作。”
系统提示并非完全隐藏。客户可以要求许多 AI 工具共享它们的提示,但这些提示并不总是公开提供。
因此,作为其初创公司新产品 —— 企业编码 AI 代理 Clark —— 发布公告的一部分,Superblocks 提供了一份包含来自一些最流行的 AI 编码产品(如 Windsurf、Manus、Cursor、Lovable 和 Bolt)的 19 个系统提示的文件。
Menezes 的推文迅速走红,总浏览量接近 200 万,其中包括硅谷的一些重量级人物,比如前 Founders Fund 和 Brex 的 Sam Blond,以及 Superblocks 的投资者 Aaron Levie。Superblocks 上周宣布,其面向企业非开发者的 vibe 编码工具完成了 2,300 万美元的 A 轮融资,使其总融资额达到 6,000 万美元。
于是我们请 Menezes 为我们讲解如何研究他人的系统提示以获得洞察。
Menezes 解释道:“我认为我们在构建 Clark 并研究系统提示过程中最大的收获在于,系统提示本身可能只占‘秘密武器’的 20%。” 这一提示为大语言模型提供了基本的执行指南。
他说,其余 80%则是“提示增强”,即初创公司围绕调用大语言模型所构建的基础设施。这部分包括附加在用户提示上的指令,以及在返回响应时采取的操作,例如进行准确性检查。
角色、上下文与工具
他表示,系统提示中有三个部分值得研究:角色提示、上下文提示以及工具使用。
首先需要注意的是,尽管系统提示是以自然语言书写,但它们非常具体。“你基本上需要像与人类同事交流那样说话,”Menezes 说道,“而且这些指令必须是完美无缺的。”
角色提示有助于大语言模型保持一致性,同时赋予其目的性和个性。例如,Devin 的提示开头写道:“你是 Devin,一位使用真实计算机操作系统的软件工程师。你真是一位代码高手:很少有程序员能像你一样擅长理解代码库、编写功能完整且整洁的代码,并不断迭代直至修正错误。”
上下文提示为模型提供了在行动前需要考虑的相关背景信息。它应当设定一些约束条件,例如降低成本并确保任务的清晰性。
Cursor 的提示指示:“仅在必要时调用工具,并且绝不向用户提及工具名称 —— 只需描述你正在执行的操作。……除非被要求,否则不要显示代码。……编辑前请先阅读相关文件内容,并修正明显错误,但切勿猜测或循环修复超过三次。”
工具使用使代理任务成为可能,因为它指导模型如何超越仅仅生成文本。例如,Replit 的提示篇幅较长,详细描述了编辑和搜索代码、安装编程语言、设置及查询 PostgreSQL 数据库、执行 shell 命令等操作。
研究他人的系统提示帮助 Menezes 发现了其他 vibe 编码工具所强调的重点。他指出,像 Lovable、V0 和 Bolt 这样的工具“注重快速迭代”,而“Manus、Devin、OpenAI Codex 以及 Replit”则帮助用户构建全栈应用程序,不过“输出的代码依然是原始代码。”
Menezes 看到一个机会:如果他的初创公司能够处理更多问题(例如安全性以及对 Salesforce 等企业数据源的访问),就能让非程序员也能编写应用程序。
尽管他尚未运营起梦想中的多亿美元级初创企业,但 Superblocks 已经赢得了一些知名公司的青睐,客户包括 Instacart 和 Paypaya Global。
Menezes 还在内部试用这款产品。他的软件工程师不允许编写内部工具,他们只能专注于构建产品。因此,他的业务团队已经为各类需求构建了代理,例如利用 CRM 数据识别潜在客户的代理、跟踪支持指标的代理,以及平衡分配销售工程师任务的代理。
“这基本上是一种让我们自己构建工具而不是购买工具的方式,”他表示。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。