Elon Musk 的 xAI 公司周一发布了其最新的人工智能旗舰模型 Grok 3。公司同时还推出了精简版 Grok 3 mini,以及一个被称为"下一代搜索引擎"的新工具 DeepSearch。xAI 为 Grok 3 的网页端和移动端应用增加了新功能,并专门为 Grok 用户推出了一项名为 SuperGrok 的订阅服务。
"我们非常兴奋地推出 Grok 3,我们认为它在短时间内的能力比 Grok 2 提升了一个数量级,"Musk 在 xAI 的 X 平台直播中表示。Grok 3 使用了 200,000 块 Nvidia H100 GPU 进行训练,是 Grok 2 的两倍。团队表示,他们花了 92 天时间扩展位于孟菲斯的超级计算机"巨人"(Colossus),以适应 Grok 3 的训练需求。
Musk 在演示中表示,Grok 3 的计算能力是 Grok 2 的 15 倍,不过他在此前的 X 平台帖子中提到是 10 倍。该模型的训练数据范围包括 X 平台用户帖子到法院文件等各类信息。
Grok 3 面临来自 OpenAI、Google 和 Anthropic 的激烈竞争,这些公司都已在 2025 年发布了新的 AI 模型或计划这样做。
Google Gemini 2.0 在二月初增加了实用功能,而 OpenAI 计划在 2025 年晚些时候推出 GPT-5 时统一其所有 AI 模型。同时,Anthropic 的下一个新 AI 模型可能在几周内发布。
如何体验 Grok 3
从 2 月 18 日开始,Grok 3 将向 X Premium Plus 会员开放,这些用户目前将拥有独家访问权,包括使用 DeepSearch 的权限。这对这些用户来说是一个小胜利,因为 X 最近将 Premium Plus 的价格从 16 美元提高到了 22 美元。
最终,xAI 将推出专门面向 Grok 3 的订阅服务 SuperGrok,其中包括 DeepSearch、更高的图像生成限制以及访问 Grok 3 mini 的功能(如 Think)。演示中未显示具体价格。
"智能得可怕"
"Grok 3 具有非常强大的推理能力,"Musk 在 2 月 13 日接受 CNBC 采访时表示。"在我们迄今进行的测试中,Grok 3 的表现超过了我们所知的任何已发布的模型。有时候,我觉得 Grok 3 聪明得有点可怕。"
当然,目前还无法测试 Grok 3 的能力。团队提到 Grok 可能会回答它认为是真实的内容——但没有提到 Grok 2 产生幻觉的倾向,或 Grok 3 会多频繁地出现这种情况。
DeepSearch
除了 Grok 3,xAI 团队还发布了 DeepSearch,这是第一代 Grok 3 代理,允许用户提问并获得答案。在直播中被称为"下一代搜索引擎"。
OpenAI 和 Google 都有类似的基于代理的搜索功能,都被称为 Deep Research。
DeepSearch 向用户展示 Grok 3 的各个处理步骤,从思考问题到研究再到最终答案。演示花了大约一分钟,引用了 15 条 X 平台帖子和 32 个网页作为参考。
DeepSearch 的另一个特点是能够查看 Grok 3 的推理过程。在回答一个关于疯狂三月篮球赛的问题后,团队使用该功能展示了 Grok 3 是如何得出结论的。
"我应该查看球队排名、常规赛表现、任何伤病或关键球员状态,可能还要看看他们在锦标赛中的历史表现数据,"当被问及时,Grok 3 这样回答。
这与中国 AI 公司 DeepSeek(于一月份推出其平台)在回答查询时包含推理过程的做法类似。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。