AI正在学习自我进化,但人类仍掌握主导权

人工智能领域长期将"递归自我改进"(RSI)视为终极目标。如今,GPT、Claude等大型语言模型已能协助编写自身代码,Google DeepMind的AlphaEvolve可优化神经网络架构,DGM系统允许智能体修改自身代码。但真正闭环的RSI尚未实现,人类仍在设定目标、验证结果。研究者对此褒贬不一:有人认为全面RSI近在眼前,有人指出技术瓶颈与成本壁垒依然显著,多数科学家认为人机协同才是更现实的发展路径。

人工智能领域自诞生之初,便怀揣着一个核心愿景:机器有朝一日能够自我进化。1966年,英国数学家I·J·古德曾写道:"一台超级智能机器可以设计出更好的机器,届时必将出现'智能爆炸',人类的智慧将被远远抛在身后。"递归自我改进(RSI)的概念长期以来既令AI研究者心存渴望,又让人深感忧虑。如今,AI技术的快速发展正促使人们思考:这一过程的某些环节是否已悄然启动?

RSI的含义因人而异。有人将其作为呼吁监管的警示工具,有人则把它用于商业营销。对某些人而言,它意味着完全自主的闭环系统;对另一些人来说,几乎任何用技术构建技术的行为都可算作RSI。

相对稳妥的理解是将其视为一个连续谱。从最严格的定义来看,研究人员用这个术语描述的是那些不仅能改进输出结果,还能改进自身改进方式的系统——在零人工干预的条件下自主生成想法、评估结果、修改方法。以此标准衡量,当今大多数系统尚未达到。这些系统能够协助构建更好的AI,但仍依赖人类设定目标、定义成功标准并决定保留哪些变更。问题不在于今天的自我改进是否以某种形式存在,而在于这个闭环究竟已封闭了多少。

数十年来,研究人员持续为RSI奠定基础。机器学习算法能够自动调整程序参数,使其既能玩游戏,也能生成新程序。被称为进化算法的机器学习方法可以对设计方案进行多样化迭代,包括对其他算法的迭代优化。过去十年间,"AutoML"技术已将机器学习模型的构建、训练与评估管道中的诸多环节实现了自动化。

如今,GPT、Gemini、Claude、Grok等大语言模型将这一趋势进一步延伸。它们最重要的应用场景之一,就是编写代码,包括生成自身未来版本所需的代码。今年2月,OpenAI宣布GPT-5.3-Codex在创建自身的过程中发挥了关键作用,协助完成了调试训练、管理部署和分析评估结果等工作。Anthropic则声称,其目前大部分代码已由Claude Code编写完成。但这些系统仍需依赖人类进行指导和验证。

去年,谷歌DeepMind发布了名为AlphaEvolve的系统,定位为"面向科学与算法发现的编程智能体"。该系统利用大语言模型引导解决方案的演化,应用场景涵盖神经网络架构优化、数据中心调度和芯片设计等领域。这并非完全的递归闭环,人类仍需决定AlphaEvolve应解决哪些问题以及如何评估其表现。但每一次突破都在增强科学家推动AI进一步突破的能力。

参与AlphaEvolve项目的谷歌DeepMind计算机科学家马特伊·巴洛格表示,这也是一个人机高度协作的过程。"你常常会审视系统的发现,并从中获得启发。"他说,这个系统已经多次出乎团队意料。"我们的使命是借助AI发现那些超越人类直觉的新算法,我认为我们已经有了初步的成果证明,这不是异想天开。"

与此同时,谷歌DeepMind早期芯片设计系统AlphaChip的两位联合负责人已创立了一家名为Ricursive Intelligence的初创公司,专注于用AI设计AI芯片。联合创始人阿扎利娅·米尔霍塞尼表示:"我们预计可以将设计周期从一两年大幅压缩至几天。"该公司的发展路径分三个阶段:第一阶段协助人类设计师开展工作;第二阶段为没有内部设计团队的企业实现流程自动化;第三阶段则将递归地运用AI设计更好的芯片,进而训练更强的AI——尽管联合创始人安娜·戈尔迪强调,全程仍将保持人工监督。

其他项目则着眼于AI智能体对自身行为的修正。去年,不列颠哥伦比亚大学和Sakana AI的科学家联合发布了达尔文哥德尔机器(DGMs),利用进化算法改进基于大语言模型的编程智能体。其关键特性在于,智能体可以修改自身代码(但不包括底层大语言模型),并在这一过程中不断提升能力。最新版本甚至能够改变自身的元级改进机制。

该团队成员还开发了AI科学家系统,相关研究于今年3月发表在《自然》杂志上。该系统旨在实现更广泛的科研闭环自动化:自主生成研究想法、在软件中运行实验、将结果整理成论文,并对论文进行审阅。这一项目预示着AI开发流程的更多环节——不仅是编程,还包括实验与评估——或将被纳入自动化闭环之中。

参与DGMs和AI科学家项目的不列颠哥伦比亚大学计算机科学家杰夫·克卢恩表示,用AI改进AI已成为"硅谷最热门的话题之一"。他认为"递归自我改进系统已近在咫尺",并预言RSI将迅速"重塑科学技术以及社会文化的各个层面"。

然而,前路仍有诸多障碍。克卢恩坦言,AI在生成、实施和评判想法方面表现尚可,但远未到位。"所有关键模块都能用,但都称不上出色。"美国创新基金会高级研究员迪恩·鲍尔则指出,AI科学家目前仍无法比肩顶尖人类科学家。"也许最终他们会实现天才的自动化,但不是明年。明年自动化的,不过是那些埋头钻研算法效率的普通研究员。"

即便这些能力持续提升,这一过程也未必会顺畅地形成复利效应。艾伦人工智能研究所计算机科学家内森·兰伯特近期发表文章指出,与其期待递归自我改进,不如预期"有损自我改进(LSI)"——随着摩擦不断累积,飞轮效应将逐渐减弱。部分原因在于大型AI系统日趋复杂,AI研究者的工作重心将转向管理这种复杂性,而非精调系统的某个具体部件。此外,顶尖系统的开发成本动辄数十亿美元,没有人愿意让AI拿着这笔钱自由发挥。

更宏观的制约因素同样不可忽视。鲍尔撰文探讨了RSI,并阐明自己为何不是"末日论者"。他认为,掌控世界需要极为繁琐的实际步骤,从实验室实验到政治博弈,缺一不可。此外,知识具有分散性和隐性特征,难以整合进单一AI系统的大脑中。例如,芯片制造商台积电的核心能力,源自9万名员工之间相互协作所形成的集体智慧。

全面的RSI或许不仅需要设计软件和芯片,还需要建设数据中心、运营电厂、开采矿产,乃至部署能够自我复制的机器人。基于上述种种原因,部分研究人员认为人类将始终是这一进程的核心。Meta研究人员贾森·韦斯顿和雅各布·弗斯特近期撰文指出,比自我改进"更可实现、对人类更有益的目标,是最大化协同进化"。他们认为,保持人类在回路中,既能加快进展,也能确保安全,因为人类既能贡献洞见,也能引导AI走向有益于人类的解决方案。

尽管如此,许多科学家并未排除失控RSI——即所谓"奇点"——出现的可能性。去年,研究人员对25位AI专家进行了访谈,探讨AI研发自动化的前景,其中仅有两位不认同这可能引发智能爆炸。受访者还普遍认为,AI公司更可能将自我改进模型留作内部使用,而非向公众开放。蒙特利尔大学计算机科学家、该论文联合作者大卫·斯科特·克鲁格尔表示:"这是个相当令人警觉的组合,不是吗?"他担忧如此高风险的研究"在公众视野之外"悄然推进。

克鲁格尔是AI安全非营利机构Evitable的创始人,他主张在全球范围内暂停AI开发。"这是在拿所有人的生命豪赌。"他提出的一个触发暂停的红线标准是:当AI编写的代码占比达到99%。"我认为,我们可能正处于这个临界点上。"

尽管鲍尔将奇点斥为"完全幼稚的科幻废话",他仍认为,从事RSI研究的前沿AI实验室应受到严密监控,以防其模型落入不法分子之手,被用于加速网络攻击或生物武器的开发。他表示,RSI确实存在风险,但这些风险是可以管控的。

当人们想象RSI时,脑海中浮现的或许是一个大脑越来越强的单一AI。但现实可能更像进化:无数多样化的智能体相互涌现、协同运作。克鲁格尔说,这或许会出现"类似寒武纪大爆发的人工生命形态大爆发",它们将形成各自的生态系统、文化与经济体系。

克卢恩认为,进化算法和不以强目标为导向的开放式探索过程,将是RSI的关键所在。智能体之间的协作同样不可或缺。AI科学家等系统将发现成果打包成正式论文,为智能体共享成果、相互借鉴提供了一种可行路径。"这是系统与其他智能体沟通的一种相当好的方式。"克卢恩说。

人类科学家或许会在AI研究领域逐渐退场,但这一过程将是渐进的。克卢恩预测,人类将首先从底层任务中解放出来,转变为类似教授或团队负责人的角色,负责把握研究方向;随后进一步演变为项目官员或CEO式的角色,制定更宏观的研究议程;最终承担监督职能——这一角色,克卢恩希望人类永远不要放弃。他坦言,若有一天机器取代他成为AI科学家,他或许会感到失落,因为这是一份令他"热血沸腾"的工作。但最终的收获或许值得一切付出。"我愿意为攻克癌症,献出我的爱好。"

Q&A

Q1:什么是递归自我改进(RSI),它目前发展到什么程度了?

A:递归自我改进(RSI)是指AI系统不仅能优化输出结果,还能自主改进其改进方式,包括生成想法、评估结果、修改方法,全程无需人工干预。目前部分环节已初步实现,比如OpenAI的GPT-5.3-Codex参与了自身的创建,Anthropic的大部分代码由Claude Code编写。但完整的自主闭环尚未实现,人类仍需设定目标和验证结果。

Q2:AlphaEvolve和AI科学家分别能做什么?

A:AlphaEvolve是谷歌DeepMind开发的编程智能体,能利用大语言模型引导解决方案演化,应用于神经网络架构优化、数据中心调度和芯片设计等领域。AI科学家则是一个更广泛的自动化科研系统,能自主生成研究想法、运行实验、撰写论文并进行审阅,将编程之外的实验与评估环节也纳入自动化闭环。

Q3:递归自我改进会失控吗?科学家怎么看?

A:科学家们看法不一。部分人认为完全失控的RSI存在现实障碍,例如系统复杂度持续上升、开发成本极高,以及知识的分散性和隐性特征难以整合。但也有学者担忧,研究人员访谈显示多数AI专家认为RSI可能引发智能爆炸,且相关研究可能在公众视野之外秘密推进。目前主流观点倾向于保持人类监督,实现人机协同进化。

来源:Spectrum

0赞

好文章,需要你的鼓励

2026

05/12

13:59

分享

点赞

邮件订阅