Elon Musk 的 AI 公司 xAI 上周发布了期待已久的旗舰 AI 模型 Grok 3。Grok 3 为移动端和网页端的 Grok 聊天机器人应用提供支持,同时也为 Musk 旗下社交网络 X 上的 Grok 体验提供支持。
考虑到当前 AI 聊天机器人领域竞争如此激烈,Grok 3 能否产生重大影响并非板上钉钉的事。仅 OpenAI 的 ChatGPT 就已经发展到每周 4 亿活跃用户。然而,初步数据表明,这个新模型确实吸引了人们下载和尝试 Grok。
根据市场情报公司 Sensor Tower 的估计,在 Grok 3 发布的那一周,Grok 在全球和美国的移动应用下载量与前一周相比都增长了超过 10 倍。同时,Grok 美国应用的日活跃用户在上周激增超过 260%,而全球日活跃用户则比前一周增长了 5 倍。
不过有一点需要注意,Grok 3 的发布恰逢 Grok 应用扩展到欧洲、拉丁美洲和东南亚的多个市场。应用的部分全球增长可能要归因于这一点。
在同一时期,Grok 的网页应用也实现了增长,这与移动应用是独立的。根据数字情报平台 Similarweb 的数据,在 Grok 3 发布后的几天里,Grok 网页应用 (具体是 Grok.com) 在美国的日访问量从约 189,000 增加到超过 900,000。在全球范围内,日访问量从 627,000 增长到 450 万。
这些数据无疑令人印象深刻。但重要的问题是 xAI 能否保持这种势头并留住这些用户。
最近的争议可能会降低人们对 Grok 3 的热情。在周末,该模型短暂审查了某些不利于特朗普总统和 Musk 的言论,xAI 将这一变化归因于一名处于失控状态的员工。几天前,用户发现 Grok 3 会一致地表示特朗普总统和 Musk 应该被处以死刑。xAI 也迅速修复了这个问题。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。