AI正在学习自我进化，但人类仍掌握主导权

人工智能领域长期将"递归自我改进"（RSI）视为终极目标。如今，GPT、Claude等大型语言模型已能协助编写自身代码，Google DeepMind的AlphaEvolve可优化神经网络架构，DGM系统允许智能体修改自身代码。但真正闭环的RSI尚未实现，人类仍在设定目标、验证结果。研究者对此褒贬不一：有人认为全面RSI近在眼前，有人指出技术瓶颈与成本壁垒依然显著，多数科学家认为人机协同才是更现实的发展路径。

人工智能领域自诞生之初，便怀揣着一个核心愿景：机器有朝一日能够自我进化。1966年，英国数学家I·J·古德曾写道："一台超级智能机器可以设计出更好的机器，届时必将出现'智能爆炸'，人类的智慧将被远远抛在身后。"递归自我改进（RSI）的概念长期以来既令AI研究者心存渴望，又让人深感忧虑。如今，AI技术的快速发展正促使人们思考：这一过程的某些环节是否已悄然启动？

RSI的含义因人而异。有人将其作为呼吁监管的警示工具，有人则把它用于商业营销。对某些人而言，它意味着完全自主的闭环系统；对另一些人来说，几乎任何用技术构建技术的行为都可算作RSI。

相对稳妥的理解是将其视为一个连续谱。从最严格的定义来看，研究人员用这个术语描述的是那些不仅能改进输出结果，还能改进自身改进方式的系统——在零人工干预的条件下自主生成想法、评估结果、修改方法。以此标准衡量，当今大多数系统尚未达到。这些系统能够协助构建更好的AI，但仍依赖人类设定目标、定义成功标准并决定保留哪些变更。问题不在于今天的自我改进是否以某种形式存在，而在于这个闭环究竟已封闭了多少。

数十年来，研究人员持续为RSI奠定基础。机器学习算法能够自动调整程序参数，使其既能玩游戏，也能生成新程序。被称为进化算法的机器学习方法可以对设计方案进行多样化迭代，包括对其他算法的迭代优化。过去十年间，"AutoML"技术已将机器学习模型的构建、训练与评估管道中的诸多环节实现了自动化。

如今，GPT、Gemini、Claude、Grok等大语言模型将这一趋势进一步延伸。它们最重要的应用场景之一，就是编写代码，包括生成自身未来版本所需的代码。今年2月，OpenAI宣布GPT-5.3-Codex在创建自身的过程中发挥了关键作用，协助完成了调试训练、管理部署和分析评估结果等工作。Anthropic则声称，其目前大部分代码已由Claude Code编写完成。但这些系统仍需依赖人类进行指导和验证。

去年，谷歌DeepMind发布了名为AlphaEvolve的系统，定位为"面向科学与算法发现的编程智能体"。该系统利用大语言模型引导解决方案的演化，应用场景涵盖神经网络架构优化、数据中心调度和芯片设计等领域。这并非完全的递归闭环，人类仍需决定AlphaEvolve应解决哪些问题以及如何评估其表现。但每一次突破都在增强科学家推动AI进一步突破的能力。

参与AlphaEvolve项目的谷歌DeepMind计算机科学家马特伊·巴洛格表示，这也是一个人机高度协作的过程。"你常常会审视系统的发现，并从中获得启发。"他说，这个系统已经多次出乎团队意料。"我们的使命是借助AI发现那些超越人类直觉的新算法，我认为我们已经有了初步的成果证明，这不是异想天开。"

与此同时，谷歌DeepMind早期芯片设计系统AlphaChip的两位联合负责人已创立了一家名为Ricursive Intelligence的初创公司，专注于用AI设计AI芯片。联合创始人阿扎利娅·米尔霍塞尼表示："我们预计可以将设计周期从一两年大幅压缩至几天。"该公司的发展路径分三个阶段：第一阶段协助人类设计师开展工作；第二阶段为没有内部设计团队的企业实现流程自动化；第三阶段则将递归地运用AI设计更好的芯片，进而训练更强的AI——尽管联合创始人安娜·戈尔迪强调，全程仍将保持人工监督。

其他项目则着眼于AI智能体对自身行为的修正。去年，不列颠哥伦比亚大学和Sakana AI的科学家联合发布了达尔文哥德尔机器（DGMs），利用进化算法改进基于大语言模型的编程智能体。其关键特性在于，智能体可以修改自身代码（但不包括底层大语言模型），并在这一过程中不断提升能力。最新版本甚至能够改变自身的元级改进机制。

该团队成员还开发了AI科学家系统，相关研究于今年3月发表在《自然》杂志上。该系统旨在实现更广泛的科研闭环自动化：自主生成研究想法、在软件中运行实验、将结果整理成论文，并对论文进行审阅。这一项目预示着AI开发流程的更多环节——不仅是编程，还包括实验与评估——或将被纳入自动化闭环之中。

参与DGMs和AI科学家项目的不列颠哥伦比亚大学计算机科学家杰夫·克卢恩表示，用AI改进AI已成为"硅谷最热门的话题之一"。他认为"递归自我改进系统已近在咫尺"，并预言RSI将迅速"重塑科学技术以及社会文化的各个层面"。

然而，前路仍有诸多障碍。克卢恩坦言，AI在生成、实施和评判想法方面表现尚可，但远未到位。"所有关键模块都能用，但都称不上出色。"美国创新基金会高级研究员迪恩·鲍尔则指出，AI科学家目前仍无法比肩顶尖人类科学家。"也许最终他们会实现天才的自动化，但不是明年。明年自动化的，不过是那些埋头钻研算法效率的普通研究员。"

即便这些能力持续提升，这一过程也未必会顺畅地形成复利效应。艾伦人工智能研究所计算机科学家内森·兰伯特近期发表文章指出，与其期待递归自我改进，不如预期"有损自我改进（LSI）"——随着摩擦不断累积，飞轮效应将逐渐减弱。部分原因在于大型AI系统日趋复杂，AI研究者的工作重心将转向管理这种复杂性，而非精调系统的某个具体部件。此外，顶尖系统的开发成本动辄数十亿美元，没有人愿意让AI拿着这笔钱自由发挥。

更宏观的制约因素同样不可忽视。鲍尔撰文探讨了RSI，并阐明自己为何不是"末日论者"。他认为，掌控世界需要极为繁琐的实际步骤，从实验室实验到政治博弈，缺一不可。此外，知识具有分散性和隐性特征，难以整合进单一AI系统的大脑中。例如，芯片制造商台积电的核心能力，源自9万名员工之间相互协作所形成的集体智慧。

全面的RSI或许不仅需要设计软件和芯片，还需要建设数据中心、运营电厂、开采矿产，乃至部署能够自我复制的机器人。基于上述种种原因，部分研究人员认为人类将始终是这一进程的核心。Meta研究人员贾森·韦斯顿和雅各布·弗斯特近期撰文指出，比自我改进"更可实现、对人类更有益的目标，是最大化协同进化"。他们认为，保持人类在回路中，既能加快进展，也能确保安全，因为人类既能贡献洞见，也能引导AI走向有益于人类的解决方案。

尽管如此，许多科学家并未排除失控RSI——即所谓"奇点"——出现的可能性。去年，研究人员对25位AI专家进行了访谈，探讨AI研发自动化的前景，其中仅有两位不认同这可能引发智能爆炸。受访者还普遍认为，AI公司更可能将自我改进模型留作内部使用，而非向公众开放。蒙特利尔大学计算机科学家、该论文联合作者大卫·斯科特·克鲁格尔表示："这是个相当令人警觉的组合，不是吗？"他担忧如此高风险的研究"在公众视野之外"悄然推进。

克鲁格尔是AI安全非营利机构Evitable的创始人，他主张在全球范围内暂停AI开发。"这是在拿所有人的生命豪赌。"他提出的一个触发暂停的红线标准是：当AI编写的代码占比达到99%。"我认为，我们可能正处于这个临界点上。"

尽管鲍尔将奇点斥为"完全幼稚的科幻废话"，他仍认为，从事RSI研究的前沿AI实验室应受到严密监控，以防其模型落入不法分子之手，被用于加速网络攻击或生物武器的开发。他表示，RSI确实存在风险，但这些风险是可以管控的。

当人们想象RSI时，脑海中浮现的或许是一个大脑越来越强的单一AI。但现实可能更像进化：无数多样化的智能体相互涌现、协同运作。克鲁格尔说，这或许会出现"类似寒武纪大爆发的人工生命形态大爆发"，它们将形成各自的生态系统、文化与经济体系。

克卢恩认为，进化算法和不以强目标为导向的开放式探索过程，将是RSI的关键所在。智能体之间的协作同样不可或缺。AI科学家等系统将发现成果打包成正式论文，为智能体共享成果、相互借鉴提供了一种可行路径。"这是系统与其他智能体沟通的一种相当好的方式。"克卢恩说。

人类科学家或许会在AI研究领域逐渐退场，但这一过程将是渐进的。克卢恩预测，人类将首先从底层任务中解放出来，转变为类似教授或团队负责人的角色，负责把握研究方向；随后进一步演变为项目官员或CEO式的角色，制定更宏观的研究议程；最终承担监督职能——这一角色，克卢恩希望人类永远不要放弃。他坦言，若有一天机器取代他成为AI科学家，他或许会感到失落，因为这是一份令他"热血沸腾"的工作。但最终的收获或许值得一切付出。"我愿意为攻克癌症，献出我的爱好。"

Q&A

Q1：什么是递归自我改进（RSI），它目前发展到什么程度了？

A：递归自我改进（RSI）是指AI系统不仅能优化输出结果，还能自主改进其改进方式，包括生成想法、评估结果、修改方法，全程无需人工干预。目前部分环节已初步实现，比如OpenAI的GPT-5.3-Codex参与了自身的创建，Anthropic的大部分代码由Claude Code编写。但完整的自主闭环尚未实现，人类仍需设定目标和验证结果。

Q2：AlphaEvolve和AI科学家分别能做什么？

A：AlphaEvolve是谷歌DeepMind开发的编程智能体，能利用大语言模型引导解决方案演化，应用于神经网络架构优化、数据中心调度和芯片设计等领域。AI科学家则是一个更广泛的自动化科研系统，能自主生成研究想法、运行实验、撰写论文并进行审阅，将编程之外的实验与评估环节也纳入自动化闭环。

Q3：递归自我改进会失控吗？科学家怎么看？

A：科学家们看法不一。部分人认为完全失控的RSI存在现实障碍，例如系统复杂度持续上升、开发成本极高，以及知识的分散性和隐性特征难以整合。但也有学者担忧，研究人员访谈显示多数AI专家认为RSI可能引发智能爆炸，且相关研究可能在公众视野之外秘密推进。目前主流观点倾向于保持人类监督，实现人机协同进化。

来源：Spectrum

0赞

好文章，需要你的鼓励

AI正在学习自我进化，但人类仍掌握主导权

来源：Spectrum

2026

05/12

13:59

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Roomba发明者全新AI机器人宠物：伴侣还是替代品？

Spotify AI DJ新增支持法语、德语、意大利语及巴西葡萄牙语

谷歌正式关闭Project Mariner实验项目

谷歌健康生态大升级：Fitbit Air发布、Fitbit应用更名、AI健身教练正式上线

月之暗面完成20亿美元融资，估值达200亿美元

Aurora CEO：自动驾驶卡车为何终于准备好大规模落地

Vibe推出可穿戴AI设备Dot，专为职场实时对话场景设计

Core Scientific押注马斯科吉：加密时代的基础设施能否驱动AI发展？

Anthropic的Mythos模型如何重塑Firefox的网络安全策略

AMD推出面向AI推理的PCIe加速卡，兼容现有服务器基础设施

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会