编者注:本文是Nemotron Labs博客系列的一部分,该系列探讨了最新的开源模型、数据集和训练技术如何帮助企业在NVIDIA平台上构建专用AI系统和应用。每篇文章都重点介绍使用开源技术栈在生产环境中创造实际价值的实用方法——从透明的研究助手到可扩展的AI智能体。
到2026年初,开源项目OpenClaw已经成为一个引人注目的现象。今年1月,随着开发者兴趣的急剧增长,其GitHub星标数突破了10万。社区数据看板和流量分析显示,单周访问量超过200万次。到3月份,OpenClaw的星标数已达25万,仅用60天就超越React,成为GitHub上星标最多的软件项目。
OpenClaw由Peter Steinberger创建,是一款可自行托管的持久化AI助手,设计为在本地或私有服务器上运行。该项目因其易用性和高度自主性而备受关注:用户无需依赖云基础设施或外部应用程序编程接口(API),即可在本地部署AI模型。
目前,大多数AI智能体由提示词触发,完成特定任务后即停止运行。而长期运行的自主智能体(即"爪")的工作方式有所不同。这类智能体在后台持续运行,自主完成任务,仅在需要人工决策时才向用户呈现信息。它们以"心跳"机制运作:每隔固定时间间隔,检查任务列表,判断哪些任务需要处理,然后执行操作或等待下一个周期。
OpenClaw的迅速普及也引发了广泛讨论。安全研究人员对自托管AI工具如何管理敏感数据、身份验证和模型更新提出了担忧。也有人质疑,本地部署是否会给用户带来新的安全风险——从未打补丁的服务器实例,到社区分叉中的恶意贡献。随着贡献者和维护者着手解决这些问题,OpenClaw的崛起在整个AI生态系统中引发了一场关于开放性、隐私保护与安全保障之间权衡取舍的更广泛讨论。
为协助提升OpenClaw项目的安全性和健壮性,NVIDIA正与Steinberger及OpenClaw开发者社区展开合作,共同解决潜在的安全漏洞,具体内容已在OpenClaw近期发布的博客文章中详细说明。
NVIDIA在模型隔离改进、本地数据访问管理优化以及社区代码贡献验证流程强化等方面贡献了代码与指导建议。此举旨在以开放、透明的方式贡献NVIDIA在安全与系统领域的专业能力,在巩固社区工作成果的同时,保留OpenClaw的独立治理架构,从而支持该项目持续向前发展。
为帮助企业更安全地运行长期智能体,NVIDIA还推出了NVIDIA NemoClaw——一套参考实现方案,通过单条命令即可安装OpenClaw、NVIDIA OpenShell安全运行时,以及针对网络、数据访问和安全进行了加固默认配置的NVIDIA Nemotron开源模型。NemoClaw为各组织提供了一套更安全地部署智能体的参考蓝图。
AI的四个发展阶段
AI已经历了四个发展阶段,且每个阶段之间的时间间隔正在不断缩短。预测式AI用了数年时间才进入主流视野;生成式AI的普及速度更快;推理式AI的到来速度更快;而以OpenClaw为代表的自主式AI浪潮,则正以更快的节奏席卷而来。
每一波浪潮所带来的复合效应体现在推理需求的持续攀升。与预测式AI相比,生成式AI的Token用量大幅增加;推理式AI在此基础上又提升了约100倍;而持续运行、跨越较长时间维度执行任务的自主智能体,其推理需求相较于推理式AI又提高了约1000倍。每一波浪潮都在成倍扩大所需的算力规模。
Token用量的增长正在帮助企业以数量级的幅度提升生产效率。例如,长期运行的智能体可以帮助研究人员在一夜之间完成问题分析,对数千种配置方案进行设计迭代,或持续监控系统并仅将需要人工判断的异常情况推送给相关人员,从而将研究人员从重复性工作中解放出来,专注于更高价值的任务。
何时该从生成式AI切换到长期智能体
尽管生成式AI已成为按需任务处理的常用工具,但在某些特定场景下,智能体持续运行的"心跳"机制具有明显优势。是否从标准提示词式AI切换到长期智能体,通常取决于工作流的性质:
从"按需响应"到"始终在线":标准模型非常适合处理即时的人工触发查询,而智能体则更适合那些需要持续后台监控或定期系统巡检、无需人工启动的任务。
管理高迭代循环:对于需要测试数千种化学组合或模拟基础设施压力测试等复杂问题,智能体能够处理那些若依赖人工干预则可能形成瓶颈的大量迭代工作。
从"提供建议"到"直接执行":在许多工作流中,标准AI用于提供信息或草稿;而当目标是让AI进入执行阶段——调用API、更新数据库或在较长时间维度内管理文件时,通常会考虑引入智能体。
资源优化:对于大规模、Token密集型的推理任务,在NVIDIA DGX Spark个人AI超级计算机等专用硬件上部署本地智能体,相比高频云API调用,能够实现更可预测的成本控制和更好的数据隐私保护。
跨行业应用场景
长期运行自主智能体的实际应用场景已延伸至各个职能部门和行业领域。
在金融服务领域,智能体持续监控交易系统和监管信息流,在每日早间审核前及时标记重要事件。在药物研发领域,智能体自动扫描最新科学文献,实时提取相关发现并更新内部数据库,无需研究人员手动介入——而此前这一流程需要数周时间。
在工程和制造领域,智能体通过测试数千种参数组合加速问题分析,对结果进行排序并标记值得深入研究的配置方案,所有这些工作都可以在一夜之间完成。
在IT运维领域,智能体诊断基础设施故障,自动应用已知修复方案,仅将新型问题上报人工处理——将平均故障解决时间从数小时压缩至数分钟。在ServiceNow,利用Apriel和NVIDIA Nemotron模型的AI专家可自主处理90%的工单。
企业部署的治理框架
自主智能体是高度"动手"的存在。它们能够发送通信内容、写入文件、调用API并更新实时系统。一旦智能体产生错误操作,就会带来真实的后果。从一开始就建立完善的问责框架至关重要,在生产环境中部署自主智能体的组织必须将治理作为首要需求来对待。
各组织需要实时了解智能体的行为,逐步审查其推理过程,对其操作进行审计,并在必要时进行干预。
负责任部署自主智能体的组织通常聚焦于以下三个优先事项:
开放且可审计的框架:NemoClaw基于OpenClaw的MIT许可代码库构建,这意味着各组织拥有完整的智能体框架所有权。他们可以读取、复刻并修改智能体构建和部署方式的每一个层级。这种透明性使团队能够在代码层面理解和掌控系统。在本地运行NVIDIA Nemotron等开源模型,可将敏感工作负载(包括患者记录、法律文件、金融交易和专有研究成果)保留在组织自身的环境中,确保追踪数据始终处于组织的管控之下。
保障运行时环境安全:NemoClaw在OpenShell沙箱环境中运行智能体,该环境精确定义了智能体可以执行和不可以执行的操作,从一开始就严格执行清晰的权限边界。
本地算力支撑:NVIDIA DGX Spark超级计算机以桌面级形态提供数据中心级GPU性能,专为持续本地推理而设计,支持全时在线运行、本地模型托管,且数据始终保存在组织环境之内。NVIDIA DGX Station系统则在此基础上进一步扩展了这一能力,专为需要同时运行多个智能体、处理复杂持续工作负载的团队而设计。
目前正在探索自主智能体实际应用的组织,正在积累一种极具价值的资产:数月的实际运营经验、基于真实工作负载构建的治理框架,以及已吸收组织知识背景、真正发挥实用价值的智能体。这一基础将随着时间的推移持续深化。
如需进一步了解,请访问关于如何在NVIDIA DGX Spark上使用NemoClaw构建更安全AI智能体的分步教程,探索NemoClaw如何通过单条命令部署更安全、始终在线的AI助手。
欢迎在GitHub上体验NemoClaw,并加入Discord社区,与其他开发者一起在DGX Spark上使用NVIDIA Nemotron 3 Super和Telegram构建NemoClaw应用。
如需获取智能体AI、NVIDIA Nemotron及更多相关资讯,欢迎订阅NVIDIA AI新闻,加入开发者社区,并在LinkedIn、Instagram、X和Facebook上关注NVIDIA AI。
Q&A
Q1:OpenClaw是什么?它与普通AI助手有什么不同?
A:OpenClaw是由Peter Steinberger创建的一款可自行托管的持久化AI助手,可在本地或私有服务器上运行,无需依赖云基础设施或外部API。与普通AI助手最大的不同在于,OpenClaw采用"心跳"机制持续在后台运行,能够自主完成任务,仅在需要人工决策时才向用户呈现信息,而非等待用户触发后才开始执行任务。
Q2:NemoClaw是什么?企业为什么要用它?
A:NemoClaw是NVIDIA推出的参考实现方案,通过单条命令即可部署OpenClaw、OpenShell安全运行时以及经过加固配置的NVIDIA Nemotron开源模型。企业使用NemoClaw的核心原因在于安全与可控:它基于MIT许可的开源代码库,支持本地运行敏感工作负载,通过OpenShell沙箱严格限制智能体权限边界,并结合NVIDIA DGX Spark等本地算力设备,帮助组织在不依赖云服务的情况下安全部署自主智能体。
Q3:自主智能体在企业中有哪些具体应用场景?
A:自主智能体的应用场景已覆盖多个行业。在金融服务领域,智能体可持续监控交易系统并及时标记重要事件;在药物研发领域,可自动扫描科学文献并实时更新数据库;在工程制造领域,可在一夜间测试数千种参数组合;在IT运维领域,可自动诊断故障并应用已知修复方案,将故障解决时间从数小时压缩至数分钟。以ServiceNow为例,其AI系统已能自主处理90%的工单。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。