Elon Musk 的 xAI 公司周一发布了其最新的人工智能旗舰模型 Grok 3。公司同时还推出了精简版 Grok 3 mini,以及一个被称为"下一代搜索引擎"的新工具 DeepSearch。xAI 为 Grok 3 的网页端和移动端应用增加了新功能,并专门为 Grok 用户推出了一项名为 SuperGrok 的订阅服务。
"我们非常兴奋地推出 Grok 3,我们认为它在短时间内的能力比 Grok 2 提升了一个数量级,"Musk 在 xAI 的 X 平台直播中表示。Grok 3 使用了 200,000 块 Nvidia H100 GPU 进行训练,是 Grok 2 的两倍。团队表示,他们花了 92 天时间扩展位于孟菲斯的超级计算机"巨人"(Colossus),以适应 Grok 3 的训练需求。
Musk 在演示中表示,Grok 3 的计算能力是 Grok 2 的 15 倍,不过他在此前的 X 平台帖子中提到是 10 倍。该模型的训练数据范围包括 X 平台用户帖子到法院文件等各类信息。
Grok 3 面临来自 OpenAI、Google 和 Anthropic 的激烈竞争,这些公司都已在 2025 年发布了新的 AI 模型或计划这样做。
Google Gemini 2.0 在二月初增加了实用功能,而 OpenAI 计划在 2025 年晚些时候推出 GPT-5 时统一其所有 AI 模型。同时,Anthropic 的下一个新 AI 模型可能在几周内发布。
如何体验 Grok 3
从 2 月 18 日开始,Grok 3 将向 X Premium Plus 会员开放,这些用户目前将拥有独家访问权,包括使用 DeepSearch 的权限。这对这些用户来说是一个小胜利,因为 X 最近将 Premium Plus 的价格从 16 美元提高到了 22 美元。
最终,xAI 将推出专门面向 Grok 3 的订阅服务 SuperGrok,其中包括 DeepSearch、更高的图像生成限制以及访问 Grok 3 mini 的功能(如 Think)。演示中未显示具体价格。
"智能得可怕"
"Grok 3 具有非常强大的推理能力,"Musk 在 2 月 13 日接受 CNBC 采访时表示。"在我们迄今进行的测试中,Grok 3 的表现超过了我们所知的任何已发布的模型。有时候,我觉得 Grok 3 聪明得有点可怕。"
当然,目前还无法测试 Grok 3 的能力。团队提到 Grok 可能会回答它认为是真实的内容——但没有提到 Grok 2 产生幻觉的倾向,或 Grok 3 会多频繁地出现这种情况。
DeepSearch
除了 Grok 3,xAI 团队还发布了 DeepSearch,这是第一代 Grok 3 代理,允许用户提问并获得答案。在直播中被称为"下一代搜索引擎"。
OpenAI 和 Google 都有类似的基于代理的搜索功能,都被称为 Deep Research。
DeepSearch 向用户展示 Grok 3 的各个处理步骤,从思考问题到研究再到最终答案。演示花了大约一分钟,引用了 15 条 X 平台帖子和 32 个网页作为参考。
DeepSearch 的另一个特点是能够查看 Grok 3 的推理过程。在回答一个关于疯狂三月篮球赛的问题后,团队使用该功能展示了 Grok 3 是如何得出结论的。
"我应该查看球队排名、常规赛表现、任何伤病或关键球员状态,可能还要看看他们在锦标赛中的历史表现数据,"当被问及时,Grok 3 这样回答。
这与中国 AI 公司 DeepSeek(于一月份推出其平台)在回答查询时包含推理过程的做法类似。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。