OpenAI发布GPT-5.6系列大语言模型，挑战Claude Mythos 5

OpenAI推出GPT-5.6系列大语言模型，包含高端Sol、中端Terra和入门级Luna三款。Sol在TerminalBench-2.1编程基准测试中得分88.8%，开启"ultra"模式后升至91.9%，超越Anthropic旗舰模型Claude Mythos 5的88%。新系列新增"max"和"ultra"两种模式，后者可并行调用多个子智能体。Sol定价为每百万输入token 5美元，输出30美元；Terra和Luna分别提供更低价格选项。目前访问权限仅限受信合作伙伴，数周内将开放公测。

OpenAI今日正式推出GPT-5.6系列大语言模型，该系列在特定编程任务上声称可超越Anthropic的Claude Mythos 5。

GPT-5.6系列共包含三款模型：高端旗舰版Sol、中端版Terra以及入门版Luna。三款模型均新增了两种此前GPT-5.5未提供的运行模式：其一为"max"模式，通过延长模型处理任务的时间来提升推理质量；其二为"ultra"模式，能够同时调度多个子智能体并行处理任务，进一步释放计算潜力。

Sol被OpenAI定位为迄今为止能力最强的大语言模型。在涵盖89项复杂编程任务的主流AI基准测试TerminalBench-2.1中，Sol取得了88.8%的得分；在开启"ultra"模式后，得分进一步提升至91.9%，超越Anthropic旗舰模型Claude Mythos 5的88%。

在网络安全研究基准测试ExploitBench上，Sol的表现接近Anthropic此前发布的Mythos Preview。值得一提的是，Mythos Preview自今年4月亮相以来，已识别出逾10,000个高危及严重级别的软件漏洞。

效率方面，OpenAI使用Sol测试了今年4月发布的科学数据分析任务集GeneBench v1，结果显示Sol在消耗更少Token的情况下，达到了前代旗舰模型的同等性能水平。

安全防护方面，Sol内置了专门的安全机制，以防止模型被用于开发黑客攻击活动等恶意行为。一旦防护机制未能阻止有害内容生成，系统将在响应到达用户前，由一个专用的大型推理模型对输出内容进行二次过滤。OpenAI还通过耗费约70万A100等效GPU小时的大规模红队测试，深入排查了可被批量利用的越狱漏洞，并据此强化了GPT-5.6系列的整体安全性。

定价方面，Sol的价格为每百万输入Token 5美元、每百万输出Token 30美元；Terra价格约为Sol的一半；Luna则在此基础上再降低约80%，为注重成本效益的用户提供更经济的选择。

在美国政府要求下，GPT-5.6系列目前仅向"少数可信合作伙伴"开放，OpenAI计划在数周内将其推向大众市场。此外，Sol还将支持Cerebras Systems旗下WSE-3晶圆级AI芯片。

Q&A

Q1：GPT-5.6系列包含哪些模型，各自有什么区别？

A：GPT-5.6系列共包含三款模型：高端旗舰版Sol、中端版Terra和入门版Luna。Sol是OpenAI目前能力最强的大语言模型，定价最高；Terra价格约为Sol的一半；Luna价格再低约80%。三款模型在性能与成本之间各有侧重，用户可根据实际需求选择。

Q2：GPT-5.6的"ultra"模式是什么，有什么作用？

A："ultra"模式是GPT-5.6新增的一种运行设置，能够同时调度多个子智能体并行处理任务。以Sol为例，在标准模式下其TerminalBench-2.1得分为88.8%，开启"ultra"模式后提升至91.9%，超越Claude Mythos 5的88%。该模式适合对输出质量要求更高的复杂任务场景。

Q3：OpenAI是如何保障GPT-5.6系列安全性的？

A：GPT-5.6系列在安全方面采取了多重措施：Sol内置了防恶意利用的安全机制，若有害内容突破防线，系统会在响应到达用户前由专用推理模型进行二次过滤。此外，OpenAI还动用约70万A100等效GPU小时进行大规模红队测试，专门排查可批量生成恶意提示词的越狱漏洞，并将测试结果用于强化模型安全性。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI发布GPT-5.6系列大语言模型，挑战Claude Mythos 5

来源：SiliconANGLE

2026

06/27

22:31

分享

点赞

美国多源电子患者数据采集方法研究综述

RF MEMS技术如何最终实现"理想开关"

Kurt Petersen：从墨迹到微机电系统王国的传奇工程师

董事会要求AI回报，但团队尚未做好准备

无需制冷剂的固态冰箱：弹热制冷技术实现-12°C突破

2025年气候科技五大突破盘点

2025年九大令人惊叹的工程技术成就

海洋地球工程崛起：初创公司如何将大海变成碳汇

碳捕捉XPrize大奖花落强化岩石风化技术，Mati Carbon凭数据软件平台胜出

无阴影空间增强现实系统让虚拟投影难辨真假

Modos Flow：两位电子纸工程师的众筹新征程

公众录像正在无意间构建全景监控体系

Agent Name Service：Linux基金会推出类DNS信任体系，为AI智能体建立身份认证框架

高通斥资39亿美元收购Modular，剑指数据中心市场格局重塑

Upscale AI完成新一轮融资，Skyhammer扩展网络技术蓄势待发

CEO与CIO对AI价值的看法存在明显分歧

Meta员工监控项目因数据保护失效被迫暂停

京东创始人：机器人将取代70万快递员，公司已启动再培训计划

IBM推进亚1纳米NanoStack芯片设计，AI算力效率迎来重大突破

挪威医院如何在不增加人手的情况下提升手术室产能

ICF报告：电网输配能力不足或制约AI时代电力增长

Nvidia跃居数据中心以太网交换机市场首位

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: