OpenAI表示,其最新推理模型已独立完成一项原创数学证明,成功推翻了几何学领域一个长期悬而未决的著名猜想。这一猜想最初由数学家保罗·埃尔德什于1946年提出。
如果你觉得这个消息似曾相识,那是因为这并非OpenAI第一次发出如此大胆的声明。七个月前,这家AI巨头的前副总裁凯文·韦尔曾在X平台发帖称:"GPT-5找到了10个(!)此前悬而未决的埃尔德什问题的解法,并在另外11个问题上取得了进展。"
然而事后证明,GPT-5并未真正解决那些问题,它只是在已有文献中找到了现成的解答。
此事随即引发了竞争对手的公开嘲讽,包括扬·勒坤以及谷歌DeepMind首席执行官德米斯·哈萨比斯。韦尔随后迅速删除了那篇言之过早的帖子。而这一次,OpenAI似乎没有重蹈覆辙。伴随本次公告,OpenAI同步发布了多位数学家的支持性评论,其中包括诺加·阿隆、梅勒妮·伍德,以及埃尔德什问题网站的维护者托马斯·布鲁姆——后者此前曾将韦尔的那篇帖子定性为"严重的错误表述"。
"近80年来,数学家们普遍认为最优解的形式大致类似于方格网络,"OpenAI在X平台上写道,"而OpenAI的模型现在已经推翻了这一认知,发现了一类全新的构型,其性能表现更为出色。"
OpenAI表示,此次突破标志着"AI首次自主解决了数学某一核心领域中一个重要的开放性问题"。据悉,这一证明来自一个新型通用推理模型,而非专门为解决数学问题甚至这一特定问题而设计的系统。
OpenAI认为,这一成果具有重要意义,因为它表明AI系统如今已能够更好地维系复杂的长链推理,并以研究人员此前可能未曾探索的方式将不同领域的思路融会贯通。这对生物学、物理学、工程学和医学等领域都具有深远影响。
"AI正在帮助我们更充分地探索人类数百年来构筑的数学殿堂,"布鲁姆在声明中表示,"还有哪些不为人知的奇迹正在等待被发现?"
Q&A
Q1:OpenAI这次解决的埃尔德什猜想具体是什么问题?
A:这个猜想由数学家保罗·埃尔德什于1946年提出,属于几何学领域的经典难题。近80年来,数学家们普遍认为该问题的最优解形式大致类似于方格网络结构。OpenAI的推理模型通过原创证明推翻了这一长期认知,发现了一类性能更优的全新构型,从而完成了对该猜想的否证。
Q2:OpenAI之前声称GPT-5解决了埃尔德什问题,这次和上次有什么不同?
A:上次,OpenAI前副总裁凯文·韦尔宣称GPT-5解决了10个埃尔德什问题,但事后证明模型只是找到了文献中已有的现成解答,并非真正意义上的原创突破,随即遭到数学家和竞争对手的批评。而这一次,OpenAI同步发布了多位知名数学家的支持性声明,证明此次推理模型完成的是真正原创的数学证明。
Q3:完成这次数学证明的是什么模型?它是专门为解数学题设计的吗?
A:完成这次证明的是OpenAI推出的一个新型通用推理模型,并非专门为解决数学问题或这一特定猜想而定制的系统。OpenAI表示,这说明AI在维系复杂长链推理、跨领域融合思路方面的能力已显著提升,对生物学、物理学、工程学和医学等领域都具有潜在影响。
好文章,需要你的鼓励
欧洲量子计算初创公司Alice & Bob正式推出其首款完整量子硬件平台——Helium量子系统,标志着该公司从量子芯片制造商升级为完整系统开发商。该系统基于独特的"猫量子比特"架构,仅需18个猫量子比特即可实现首个逻辑量子比特的编码,并集成了处理器架构、控制电子设备及监控软件Starboard。系统功耗仅40千瓦,支持量子与经典计算资源的协同部署,面向高性能计算场景开放研究合作。
韩国科学技术院团队构建的SoCRATES框架,系统评估AI调解员在八类冲突场景和五种社会认知维度下的表现,发现即使最强模型也仅能弥合约三分之一的分歧。
Intuit首席AI官Ashok Srivastava对外界盛传的"AI颠覆SaaS"论调保持冷静,认为SaaS行业的演变本是持续循环的一部分。他表示,公司通过引入AI智能体,过去一年开发速度提升40%,五年内开发效率提升12倍。QuickBooks Live订阅量因AI加入翻倍增长,QuickBooks Capital平台同比增长73%。Srivastava同时强调,Intuit拒绝"Token最大化"策略,坚持以服务客户为核心,在合规监管环境下稳步推进AI落地。
中山大学与Datawhale研究团队发现,在扩散模型训练中,让AI用自身输出的结构熵自动调节学习权重,可令音乐生成模型产生更清晰的段落结构和音色分化。