马斯克发布了一款比 ChatGPT 更智能的 AI — 这意味着什么

马斯克的 AI 公司 xAI 推出了 Grok 3 模型，号称在多项技术指标上超越竞争对手。这款 AI 在数学、科学推理和编程等方面表现出色，并在用户测试中领先 GPT-4 等模型。Grok 3 的发布标志着 AI 领域竞争加剧，也凸显了马斯克与 OpenAI 之间的紧张关系。

马斯克的人工智能初创公司 xAI 推出了其最新的 AI 模型 Grok 3，该公司声称该模型在关键技术基准测试中超越了主要竞争对手。这一发布标志着开发更强大 AI 系统竞赛的重大升级。

此次发布恰逢马斯克以 974 亿美元收购 OpenAI 失败之后，他曾在 2015 年与山姆·奥特曼共同创立了该公司。在 X 平台的直播演示中，马斯克表示 Grok 3 的能力"比 Grok 2 强大一个数量级"，并强调了其解决复杂问题的推理能力。

早期测试似乎支持了 xAI 的部分声明。该模型在影响力巨大的 Chatbot Arena 排行榜上名列榜首，在盲测中得分高于 OpenAI 的 GPT-4、Google 的 Gemini 和 DeepSeek 的 V3 模型。公布的基准测试显示，Grok 3 在数学 (AIME '24)、科学推理 (GPQA) 和编程任务方面取得了更优异的成绩。

在 Chatbot Arena 排行榜上，Grok 3 以约 1400 的分数领先，在盲测中明显优于其他主要 AI 模型。(来源：xAI)

Grok 3 的庞大计算基础设施：20 万个 GPU 和一个新数据中心

前 OpenAI 研究员 Andrej Karpathy 在早期测试后发布 X 帖子称："Grok 3 明显具有最先进的思维能力。很少有模型能可靠地做到这一点。OpenAI 顶级思维模型也能做到，但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都做不到。"

该模型的开发需要海量计算资源。xAI 将其 GPU 集群扩大一倍至 20 万块 Nvidia 芯片用于训练，这些设备位于孟菲斯的新数据中心。随着各公司竞相开发更强大的系统，这项基础设施投资凸显了先进 AI 开发对计算能力日益增长的需求。

DeepSearch 和高级推理：Grok 3 如何致力于超越 ChatGPT 和 Google Gemini

Grok 3 的一项关键创新是"DeepSearch"功能，它将网络搜索与推理能力相结合，可以分析来自多个来源的信息。该系统还包括用于复杂问题解决的专门模式，包括展示其推理过程的"Think"功能和为困难任务分配额外计算能力的"Big Brain"模式。

然而，测试过程中也发现了一些局限性。Karpathy 指出，该模型有时会编造引用来源，并且在处理某些类型的幽默和伦理推理任务时存在困难。这些挑战是当前 AI 系统的共同问题，突显了在开发真正类人工智能方面持续存在的困难。

Scale.ai 首席执行官 Alexandr Wang 在推特上称赞此次发布："Grok 3 是来自 @xai 团队的全球最佳新模型！"他指出其在各种基准测试中的卓越表现，并对未来合作表示期待。

AI 行业竞争升温：Grok 3 的发布对 OpenAI、DeepSeek 和人工智能的未来意味着什么

该模型将通过 X 的 Premium+ 订阅服务 (每月 40 美元) 和新的独立"SuperGrok"服务 (每月 30 美元) 提供。企业级 API 访问计划将在未来几周内推出。

此次发布加剧了 AI 行业的竞争，特别是在中国初创公司 DeepSeek 最近展示了可比性能，据报道其计算需求更低的情况下。这一发展也引发了对 AI 计算军备竞赛可持续性的质疑，因为各公司正在投资数十亿美元用于越来越强大的硬件基础设施。

在关键性能基准测试中，Grok 3 及其迷你版本在数学、科学和编程测试中的得分均优于 Google、OpenAI、Anthropic 和 DeepSeek 的竞争模型。完整版 Grok 3 模型（深蓝色）在科学推理方面取得了特别出色的结果。(来源：xAI)

马斯克强调，Grok 3 仍处于测试阶段，预计"几乎每天"都会有改进。该公司计划在几周内添加语音交互功能，并将在新版本稳定后开源其前代模型 Grok 2。

然而，Grok 3 首次亮相最引人注目的也许不是其技术规格或基准测试分数，而是它所代表的含义：马斯克与其前 OpenAI 同事之间日益紧张的关系。就在以 974 亿美元收购 OpenAI 失败几天后，马斯克推出了一个挑战其霸主地位的模型 — 这表明在 AI 主导权的高风险竞赛中，即使是被拒绝的收购者也能成为一个强大的竞争对手。

来源：VentureBeat

0赞

好文章，需要你的鼓励

马斯克发布了一款比 ChatGPT 更智能的 AI — 这意味着什么

来源：VentureBeat

2025

02/19

16:27

分享

点赞

“4个9”韧性的背后，西云数据以技术与运营加速企业数字化创新

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: