Elon Musk 的 xAI 公司周二发布了 Grok-3,宣布这款新的人工智能模型比其前代产品具有"超过 10 倍"的计算能力。xAI 表示,其最新旗舰产品在早期测试中表现超过了 OpenAI 的 GPT-4,Google 的 Gemini 和 DeepSeek 的 V3 模型,并且现在具备"高级推理"能力。
所谓的推理模型,是通过将指令分解成更小的任务来训练,并在提供解决方案之前尝试自我事实核查,以提供更强大的结果。类似的模型已经被竞争对手开发,包括 OpenAI 的 o1、DeepSeek 的 R1 和 Google 的 Gemini Flash Thinking。
Grok-3 提供两种推理模式:"思考"模式,将显示 Grok 解决请求时的推理过程;以及"大脑"模式,用于需要更多计算能力的复杂任务。xAI 还推出了一款名为 Deep Search 的 Grok AI 代理产品,该公司将其描述为"下一代搜索引擎"。
这些是 Grok 应用程序中的新推理选项。
图片:xAI
Musk 表示,Grok-3 是一个"最大程度寻求真理的 AI——即使这个真理有时与政治正确相悖"。xAI 聊天机器人的前几个版本曾因传播选举虚假信息和在文本生成图像方面限制较少而受到批评,这使得它可能产生有争议或冒犯性的图像。OpenAI 也在探索如何开发其模型以在处理有争议话题时"寻求真理",但目标是保持某些安全限制。
Grok-3 的推理功能现已向 X Premium Plus 订阅用户开放,订阅费用现在起价为每月 40 美元。这是两个月内 Premium Plus 的第二次涨价,此前在 12 月份从 16 美元上调至 22 美元。xAI 表示还将推出一个名为 SuperGrok 的新订阅计划,该计划将提供"最先进的功能和最早获取新特性的机会"。据报道,SuperGrok 的费用将为每月 30 美元,但目前尚不清楚这是否是 X 订阅之外的额外费用。
Elon Musk 表示,Grok 聊天机器人即将获得一个合成语音功能,类似于 OpenAI 为 ChatGPT 提供的高级语音模式。xAI 还计划在未来几个月内开源 Grok-2。
好文章,需要你的鼓励
埃森哲投资AI零售平台Profitmind,该平台通过智能代理自动化定价决策、库存管理和规划。研究显示AI驱动了2025年假日购物季20%的消费,约2620亿美元。部署AI代理的企业假日销售同比增长6.2%,而未部署的仅增长3.9%。Profitmind实时监控竞争对手价格和营销策略,并可创建生成式引擎优化产品文案。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。