Elon Musk 的 xAI 公司周二发布了 Grok-3,宣布这款新的人工智能模型比其前代产品具有"超过 10 倍"的计算能力。xAI 表示,其最新旗舰产品在早期测试中表现超过了 OpenAI 的 GPT-4,Google 的 Gemini 和 DeepSeek 的 V3 模型,并且现在具备"高级推理"能力。
所谓的推理模型,是通过将指令分解成更小的任务来训练,并在提供解决方案之前尝试自我事实核查,以提供更强大的结果。类似的模型已经被竞争对手开发,包括 OpenAI 的 o1、DeepSeek 的 R1 和 Google 的 Gemini Flash Thinking。
Grok-3 提供两种推理模式:"思考"模式,将显示 Grok 解决请求时的推理过程;以及"大脑"模式,用于需要更多计算能力的复杂任务。xAI 还推出了一款名为 Deep Search 的 Grok AI 代理产品,该公司将其描述为"下一代搜索引擎"。
这些是 Grok 应用程序中的新推理选项。
图片:xAI
Musk 表示,Grok-3 是一个"最大程度寻求真理的 AI——即使这个真理有时与政治正确相悖"。xAI 聊天机器人的前几个版本曾因传播选举虚假信息和在文本生成图像方面限制较少而受到批评,这使得它可能产生有争议或冒犯性的图像。OpenAI 也在探索如何开发其模型以在处理有争议话题时"寻求真理",但目标是保持某些安全限制。
Grok-3 的推理功能现已向 X Premium Plus 订阅用户开放,订阅费用现在起价为每月 40 美元。这是两个月内 Premium Plus 的第二次涨价,此前在 12 月份从 16 美元上调至 22 美元。xAI 表示还将推出一个名为 SuperGrok 的新订阅计划,该计划将提供"最先进的功能和最早获取新特性的机会"。据报道,SuperGrok 的费用将为每月 30 美元,但目前尚不清楚这是否是 X 订阅之外的额外费用。
Elon Musk 表示,Grok 聊天机器人即将获得一个合成语音功能,类似于 OpenAI 为 ChatGPT 提供的高级语音模式。xAI 还计划在未来几个月内开源 Grok-2。
好文章,需要你的鼓励
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
科技行业女性从业者比例从2015年的16%增至2025年的22%,进步缓慢。尽管各种倡议不断推进,但多元化员工仍面临离职率高、薪酬差距和发展机会不足等问题。2025年经济不确定性导致企业削减多元化项目,美国政策变化也产生连锁反应。随着AI技术快速发展,缺乏多元化团队将导致技术偏见,影响产品质量和市场表现。2026年将成为科技行业多元化发展的关键节点。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。