企业在构建和扩展智能体时需要认识到一个现实:智能体的构建方式与传统软件截然不同。
Writer公司首席执行官兼联合创始人May Habib表示,智能体在构建方式、运行机制和改进方法上都存在"本质差异"。这意味着在处理自适应系统时,传统的软件开发生命周期模式已不再适用。
"智能体无法可靠地遵循规则,"Habib在VB Transform大会上表示。"它们是结果驱动的,具备解释和适应能力,其行为只有在真实环境中才会显现。"
这些洞察来自Habib帮助数百家企业客户构建和扩展企业级智能体的实践经验。据透露,超过350家财富1000强企业是Writer的客户,预计到2025年底,超过一半的财富500强企业将通过Writer扩展智能体应用。
使用非确定性技术产生强大输出可能"极其复杂",特别是在系统性扩展智能体时。即使企业团队可以在没有产品经理和设计师的情况下启动智能体,Habib认为在协作、构建、迭代和维护智能体时仍需要"产品经理思维"。
"无论是不幸还是幸运,如果IT部门不引导业务合作伙伴采用新的构建方式,最终将承担所有责任。"
**目标导向智能体的优势**
思维转变包括理解智能体的结果导向本质。例如,许多客户要求智能体协助法务团队审查或修改合同,但这种要求过于宽泛。相反,目标导向方法意味着设计智能体来减少审查和修改合同的时间。
"在传统软件开发生命周期中,你为一组确定性的可预测步骤进行设计,"Habib说。"输入输出更加确定性。但对于智能体,你需要塑造智能体行为,提供上下文并引导智能体的决策制定。"
另一个差异是为智能体构建包含业务逻辑的蓝图,而不是提供工作流程。这包括设计推理循环,与领域专家合作映射促进期望行为的流程。
虽然关于扩展智能体的讨论很多,Writer仍在帮助大多数客户逐个构建智能体。这是因为首先需要明确谁拥有和审计智能体,谁确保其保持相关性,以及谁检查是否仍在产生期望结果。
"如果没有新的构建和扩展方法,人们很快就会遇到扩展瓶颈,"Habib说。"当组织负责任管理智能体的能力超过各部门开发pace时,就会遇到这个瓶颈。"
**智能体与软件的质量保证差异**
智能体的质量保证也有所不同。智能体评估需要考虑非二进制行为,评估智能体在真实情况下的表现,而不是客观清单。失败并不总是明显的,也不像检查某些功能是否中断那样黑白分明。相反,Habib建议检查智能体是否行为良好,询问安全措施是否有效,评估结果和意图:"目标不是完美,而是行为信心,因为这里存在很多主观性。"
不理解迭代重要性的企业最终会陷入"持续的网球比赛,直到双方都不想再玩"。团队接受智能体不完美也很重要,更多地关注"安全发布、快速运行和反复迭代"。
尽管面临挑战,已有AI智能体帮助企业带来新收入的实例。Habib提到一家大型银行与Writer合作开发基于智能体的系统,通过将新客户引入多个产品线,创造了价值6亿美元的新追销渠道。
**AI智能体的新版本控制**
智能体维护也不同。传统软件维护涉及在出现问题时检查代码,但AI智能体需要新的版本控制来管理所有可能影响行为的因素。这还需要适当的治理,确保智能体随时间保持有用性,而不是产生不必要的成本。
由于模型与AI智能体之间没有清晰映射,维护包括检查提示、模型设置、工具架构和内存配置。这也意味着完全跟踪输入、输出、推理步骤、工具调用和人机交互的执行过程。
"你可以更新大语言模型提示,观察智能体行为完全改变,即使git历史中实际上没有任何变化,"Habib说。"模型链接变化,检索索引更新,工具API演进,相同提示的行为突然不如预期...感觉像在调试幽灵。"
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。