Elon Musk 的 xAI 公司周一发布了其最新的人工智能旗舰模型 Grok 3。公司同时还推出了精简版 Grok 3 mini,以及一个被称为"下一代搜索引擎"的新工具 DeepSearch。xAI 为 Grok 3 的网页端和移动端应用增加了新功能,并专门为 Grok 用户推出了一项名为 SuperGrok 的订阅服务。
"我们非常兴奋地推出 Grok 3,我们认为它在短时间内的能力比 Grok 2 提升了一个数量级,"Musk 在 xAI 的 X 平台直播中表示。Grok 3 使用了 200,000 块 Nvidia H100 GPU 进行训练,是 Grok 2 的两倍。团队表示,他们花了 92 天时间扩展位于孟菲斯的超级计算机"巨人"(Colossus),以适应 Grok 3 的训练需求。
Musk 在演示中表示,Grok 3 的计算能力是 Grok 2 的 15 倍,不过他在此前的 X 平台帖子中提到是 10 倍。该模型的训练数据范围包括 X 平台用户帖子到法院文件等各类信息。
Grok 3 面临来自 OpenAI、Google 和 Anthropic 的激烈竞争,这些公司都已在 2025 年发布了新的 AI 模型或计划这样做。
Google Gemini 2.0 在二月初增加了实用功能,而 OpenAI 计划在 2025 年晚些时候推出 GPT-5 时统一其所有 AI 模型。同时,Anthropic 的下一个新 AI 模型可能在几周内发布。
如何体验 Grok 3
从 2 月 18 日开始,Grok 3 将向 X Premium Plus 会员开放,这些用户目前将拥有独家访问权,包括使用 DeepSearch 的权限。这对这些用户来说是一个小胜利,因为 X 最近将 Premium Plus 的价格从 16 美元提高到了 22 美元。
最终,xAI 将推出专门面向 Grok 3 的订阅服务 SuperGrok,其中包括 DeepSearch、更高的图像生成限制以及访问 Grok 3 mini 的功能(如 Think)。演示中未显示具体价格。
"智能得可怕"
"Grok 3 具有非常强大的推理能力,"Musk 在 2 月 13 日接受 CNBC 采访时表示。"在我们迄今进行的测试中,Grok 3 的表现超过了我们所知的任何已发布的模型。有时候,我觉得 Grok 3 聪明得有点可怕。"
当然,目前还无法测试 Grok 3 的能力。团队提到 Grok 可能会回答它认为是真实的内容——但没有提到 Grok 2 产生幻觉的倾向,或 Grok 3 会多频繁地出现这种情况。
DeepSearch
除了 Grok 3,xAI 团队还发布了 DeepSearch,这是第一代 Grok 3 代理,允许用户提问并获得答案。在直播中被称为"下一代搜索引擎"。
OpenAI 和 Google 都有类似的基于代理的搜索功能,都被称为 Deep Research。
DeepSearch 向用户展示 Grok 3 的各个处理步骤,从思考问题到研究再到最终答案。演示花了大约一分钟,引用了 15 条 X 平台帖子和 32 个网页作为参考。
DeepSearch 的另一个特点是能够查看 Grok 3 的推理过程。在回答一个关于疯狂三月篮球赛的问题后,团队使用该功能展示了 Grok 3 是如何得出结论的。
"我应该查看球队排名、常规赛表现、任何伤病或关键球员状态,可能还要看看他们在锦标赛中的历史表现数据,"当被问及时,Grok 3 这样回答。
这与中国 AI 公司 DeepSeek(于一月份推出其平台)在回答查询时包含推理过程的做法类似。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。