Elon Musk 的 xAI 公司周二发布了 Grok-3,宣布这款新的人工智能模型比其前代产品具有"超过 10 倍"的计算能力。xAI 表示,其最新旗舰产品在早期测试中表现超过了 OpenAI 的 GPT-4,Google 的 Gemini 和 DeepSeek 的 V3 模型,并且现在具备"高级推理"能力。
所谓的推理模型,是通过将指令分解成更小的任务来训练,并在提供解决方案之前尝试自我事实核查,以提供更强大的结果。类似的模型已经被竞争对手开发,包括 OpenAI 的 o1、DeepSeek 的 R1 和 Google 的 Gemini Flash Thinking。
Grok-3 提供两种推理模式:"思考"模式,将显示 Grok 解决请求时的推理过程;以及"大脑"模式,用于需要更多计算能力的复杂任务。xAI 还推出了一款名为 Deep Search 的 Grok AI 代理产品,该公司将其描述为"下一代搜索引擎"。
这些是 Grok 应用程序中的新推理选项。
图片:xAI
Musk 表示,Grok-3 是一个"最大程度寻求真理的 AI——即使这个真理有时与政治正确相悖"。xAI 聊天机器人的前几个版本曾因传播选举虚假信息和在文本生成图像方面限制较少而受到批评,这使得它可能产生有争议或冒犯性的图像。OpenAI 也在探索如何开发其模型以在处理有争议话题时"寻求真理",但目标是保持某些安全限制。
Grok-3 的推理功能现已向 X Premium Plus 订阅用户开放,订阅费用现在起价为每月 40 美元。这是两个月内 Premium Plus 的第二次涨价,此前在 12 月份从 16 美元上调至 22 美元。xAI 表示还将推出一个名为 SuperGrok 的新订阅计划,该计划将提供"最先进的功能和最早获取新特性的机会"。据报道,SuperGrok 的费用将为每月 30 美元,但目前尚不清楚这是否是 X 订阅之外的额外费用。
Elon Musk 表示,Grok 聊天机器人即将获得一个合成语音功能,类似于 OpenAI 为 ChatGPT 提供的高级语音模式。xAI 还计划在未来几个月内开源 Grok-2。
好文章,需要你的鼓励
是德科技高级副总裁兼通信解决方案事业部总裁Kailash Narayanan现场指出,算力固然重要,但如果能耗过高,技术的实用性将大打折扣,因此,所有的高速、高性能计算,都必须在极低的功耗下实现,这是AI等技术能否大规模落地的核心前提。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。