Elon Musk 的 xAI 公司于周一深夜宣布推出 Grok-3,这是该公司大语言模型家族的最新成员。
该公司表示,这个 AI 模型相比其前代 Grok-2 实现了重大突破,加入了"推理模型"以模拟人类思维。
在直播发布会上,xAI 的研究人员表示,Grok-3 的训练使用了比 Grok-2 多 10 到 15 倍的计算能力。该公司于 9 月份推出了一个名为 Colossus 的大型超级计算机训练系统,配备了 100,000 个 Nvidia 公司的 H100 图形处理单元,专门用于推出 Grok 的新版本。
"Grok-3 的整体表现独具一格," CEO Elon Musk 在发布会上表示。他声称根据早期测试结果,该模型在数学、科学和编程方面的表现超过了 OpenAI 和中国 DeepSeek 的模型。
Grok-3 包含两个主要推理模型:Grok-3 Reasoning beta (一个大型复杂模型) 和 Grok-3 mini Reasoning (一个能快速生成答案的小型快速模型)。在 xAI 的聊天机器人中启用这些模型后,它们会在处理复杂的科学、数学和编程问题时展示其"思考"过程,进行逐步推理。
此次发布恰逢其他公司开始推出推理模型,这些模型能将复杂任务分解为更小的任务,并在提供解决方案前进行自我事实核查。这样做的目的是提供更好的结果。竞争对手开发的类似模型包括 OpenAI 的 o1 和 o3-mini reasoning、DeepSeek 的 R1 以及 Google 的 Gemini 2.0 Flash Thinking Experimental。
"我们需要强调这是一个测试版,这意味着一开始可能会有一些不完善之处,但我们会快速改进,几乎每天都会更新," Musk 补充道。
用户可以启用"Think"功能来使用 Grok-3 模型的推理能力。对于更难的问题,他们可以激活"Big Brain"模式,xAI 表示这最适合处理涉及数学、科学或编程推理的复杂查询。
Grok-3 的推理模式还可以与名为"DeepSearch"的搜索功能配合使用,虽然需要更长时间,但模型会扫描互联网寻找相关知识并将其整合到答案中。xAI 表示使用 DeepSearch 将获得更相关、更详细的回答。
增加这种深度互联网研究能力意味着 xAI 的模型将加入拥有类似功能的竞争对手行列,包括 OpenAI 和 Google。AI 搜索引擎创建者 Perplexity AI 公司在提供搜索答案时直接将深度互联网研究融入其服务中。
Grok-3 还将获得语音模式,允许其用语音回答查询。虽然该功能在发布时尚未推出,但 Musk 表示将在一周左右内推出。Musk 补充说,Grok 的语音模式不仅仅是语音转文本,它将能理解语调、语气和节奏,"就像与真人对话一样"。
好文章,需要你的鼓励
随着AI在各行业深度应用,传统的"学会编程"建议已不再适用。UCLA等机构的CIO表示,现在更看重候选人的批判性思维、问题解决能力和适应技术变化的敏捷性。新毕业生需要展现AI素养、数据理解能力、云技术expertise和安全意识。编程岗位演变为更具战略性的角色,类似指挥家协调AI工具。入门级职位因自动化而减少,求职者需具备更高技能水平,能够与AI协作而非被其取代。
加州大学伯克利分校研究团队成功让Transformer AI直接从原子三维坐标学习分子结构,无需传统的分子图谱。10亿参数模型在OMol25数据集上的表现可媲美先进图神经网络,且运行更快。AI自发学会了距离-相互作用关系,并能根据分子环境自适应调整关注范围。研究验证了分子AI的规模定律,暗示更大模型将带来更好性能。这项工作为分子建模提供了全新范式,有望推动药物设计和材料科学发展。
9月份LockBit勒索软件新版本的幕后操作者大幅扩大了攻击目标,整体勒索软件攻击激增超过四分之一。NCC集团报告显示攻击量六个月来首次上升28%至421起事件。尽管LockBit曾在Operation Cronos行动中被重创,但其管理员LockBitSupp持续活动。LockBit 5.0新增多平台支持、增强反分析功能、更快加密速度等特性,9月份至少造成十几个受害者,标志着该组织运营恢复。
MediaTek Research团队提出颠覆性"沙漏"MLP架构,将传统"窄-宽-窄"设计反转为"宽-窄-宽",在高维空间进行渐进改进。通过固定随机投影技术,新架构在多项生成任务中显著优于传统设计,用更少参数实现更好性能。研究验证了高维空间增量学习的优越性,为神经网络设计开辟新思路,并展示了向变换器等架构扩展的潜力。