GPT-5.4在2011年预印本研究帮助下解决此前无解数学难题

AI测试公司Epoch AI发现，GPT-5.4 Pro在数学挑战中取得重大突破，解决了一个此前所有模型都未能攻克的四级难题。该模型通过找到一篇2011年被遗忘的预印本论文，巧妙地简化了解题过程。除数学能力提升外，GPT-5.4 Pro还首次实现了计算机操作功能，能够执行鼠标点击等指令，并在电子表格处理和复杂任务规划方面展现出显著改进。

GPT在数学问题解决能力方面持续提升，越来越能够攻克最棘手的难题。

今年1月，AI测试公司Epoch AI发现，AI模型的前一个版本GPT-5.2 Pro已经解决了31%的数学挑战，相比之前19%的最佳成绩有了显著提升。

最新版本延续了这一进步趋势，成功应对了学者们设置的一系列数学问题。

根据Epoch AI博客文章，GPT-5.4更进一步：该博客提到，"GPT-5.4 Pro解决了一个此前没有任何模型能够解决的4级难题。在初步分析中，它似乎找到了一篇2011年的预印本，这让它绕过了大部分预期的工作量。问题作者并不知道这篇预印本的存在。"这里提到的预印本是指尚未经过同行评议的学术论文。

虽然"解决"了这个问题，但这也说明了GPT-5.4（实际上所有AI模型都是如此）本质上是精密的搜索引擎，其有效性取决于对信息的获取和快速整合能力。

GPT-5.4 Pro还提供了其他几项创新功能。OpenAI声称这是第一个能够在计算机上执行操作的版本，而不仅仅是说明如何操作。例如，GPT-5.4 Pro可以点击鼠标——更准确地说，它可以向智能体发出"点击鼠标"的命令。

该模型还具有改进的电子表格处理能力，能够使用更少的Token来解决问题，并且会在处理复杂任务前制定计划，让用户有机会调整结果并引导其朝正确方向发展。

Q&A

Q1：GPT-5.4 Pro在数学能力上有什么突破？

A：GPT-5.4 Pro解决了一个此前没有任何AI模型能够解决的4级数学难题。该模型找到了一篇2011年的预印本研究，利用其中的方法绕过了大部分预期的计算工作。相比之前版本31%的数学挑战解决率，最新版本继续保持进步趋势。

Q2：GPT-5.4 Pro除了数学能力外还有哪些新功能？

A：GPT-5.4 Pro是首个能在计算机上直接执行操作的版本，比如可以向智能体发出"点击鼠标"命令。它还具有改进的电子表格处理技能，能用更少Token解决问题，并会在处理复杂任务前先制定计划供用户调整。

Q3：GPT-5.4解决数学问题说明了什么？

A：这次解题过程说明GPT-5.4和所有AI模型本质上都是精密的搜索引擎，其有效性主要依赖于对信息的快速获取和整合能力。虽然"解决"了问题，但实际上是通过找到相关研究资料来实现的。

来源：Computerworld

0赞

好文章，需要你的鼓励

GPT-5.4在2011年预印本研究帮助下解决此前无解数学难题

来源：Computerworld

2026

03/10

17:15

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

MacBook Pro 16 M5 Pro/Max评测：极速性能新体验

ABB Robotics 携手英伟达 Omniverse 实现工业级物理AI规模化应用

伦敦"超级计算机"项目背后：脚手架场地与AI投资泡沫

英特尔发布Core Series 2处理器，扩展边缘AI产品线

微软集成Claude模型打造更强Copilot智能体助手

AI自动审核系统可减少企业负面回应提升服务质量

美国民众对AI好感度排名倒数，支持率仅26%

Anthropic推出AI代码审查工具应对AI生成代码激增

影子AI兴起，企业领导者选择速度而非治理

AI如何改变数学研究的本质

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会