Elon Musk 的 xAI 公司周一发布了其最新的人工智能旗舰模型 Grok 3。公司同时还推出了精简版 Grok 3 mini,以及一个被称为"下一代搜索引擎"的新工具 DeepSearch。xAI 为 Grok 3 的网页端和移动端应用增加了新功能,并专门为 Grok 用户推出了一项名为 SuperGrok 的订阅服务。
"我们非常兴奋地推出 Grok 3,我们认为它在短时间内的能力比 Grok 2 提升了一个数量级,"Musk 在 xAI 的 X 平台直播中表示。Grok 3 使用了 200,000 块 Nvidia H100 GPU 进行训练,是 Grok 2 的两倍。团队表示,他们花了 92 天时间扩展位于孟菲斯的超级计算机"巨人"(Colossus),以适应 Grok 3 的训练需求。
Musk 在演示中表示,Grok 3 的计算能力是 Grok 2 的 15 倍,不过他在此前的 X 平台帖子中提到是 10 倍。该模型的训练数据范围包括 X 平台用户帖子到法院文件等各类信息。
Grok 3 面临来自 OpenAI、Google 和 Anthropic 的激烈竞争,这些公司都已在 2025 年发布了新的 AI 模型或计划这样做。
Google Gemini 2.0 在二月初增加了实用功能,而 OpenAI 计划在 2025 年晚些时候推出 GPT-5 时统一其所有 AI 模型。同时,Anthropic 的下一个新 AI 模型可能在几周内发布。
如何体验 Grok 3
从 2 月 18 日开始,Grok 3 将向 X Premium Plus 会员开放,这些用户目前将拥有独家访问权,包括使用 DeepSearch 的权限。这对这些用户来说是一个小胜利,因为 X 最近将 Premium Plus 的价格从 16 美元提高到了 22 美元。
最终,xAI 将推出专门面向 Grok 3 的订阅服务 SuperGrok,其中包括 DeepSearch、更高的图像生成限制以及访问 Grok 3 mini 的功能(如 Think)。演示中未显示具体价格。
"智能得可怕"
"Grok 3 具有非常强大的推理能力,"Musk 在 2 月 13 日接受 CNBC 采访时表示。"在我们迄今进行的测试中,Grok 3 的表现超过了我们所知的任何已发布的模型。有时候,我觉得 Grok 3 聪明得有点可怕。"
当然,目前还无法测试 Grok 3 的能力。团队提到 Grok 可能会回答它认为是真实的内容——但没有提到 Grok 2 产生幻觉的倾向,或 Grok 3 会多频繁地出现这种情况。
DeepSearch
除了 Grok 3,xAI 团队还发布了 DeepSearch,这是第一代 Grok 3 代理,允许用户提问并获得答案。在直播中被称为"下一代搜索引擎"。
OpenAI 和 Google 都有类似的基于代理的搜索功能,都被称为 Deep Research。
DeepSearch 向用户展示 Grok 3 的各个处理步骤,从思考问题到研究再到最终答案。演示花了大约一分钟,引用了 15 条 X 平台帖子和 32 个网页作为参考。
DeepSearch 的另一个特点是能够查看 Grok 3 的推理过程。在回答一个关于疯狂三月篮球赛的问题后,团队使用该功能展示了 Grok 3 是如何得出结论的。
"我应该查看球队排名、常规赛表现、任何伤病或关键球员状态,可能还要看看他们在锦标赛中的历史表现数据,"当被问及时,Grok 3 这样回答。
这与中国 AI 公司 DeepSeek(于一月份推出其平台)在回答查询时包含推理过程的做法类似。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。