亿万富翁 Elon Musk 虽然刚刚被 OpenAI 提起反诉,但这并没有阻止他的 AI 公司 xAI 推出其旗舰产品 Grok 3 模型的 API 服务。
在 xAI 发布 Grok 3 已经过去数月,该模型是公司对标 OpenAI 的 GPT-4 和 Google 的 Gemini 的产品。Grok 3 具备图像分析和问答能力,为 Musk 的社交网络 X(该平台在三月收购了 xAI)提供了多项功能支持。
xAI 在其 API 中提供两个版本的 Grok 3:标准版 Grok 3 和具备"推理"能力的 Grok 3 Mini。
Grok 3 的定价为:输入每百万 token (约 75 万字) 收费 3 美元,模型生成每百万 token 收费 15 美元。Grok 3 Mini 则是每百万输入 token 收费 0.30 美元,每百万输出 token 收费 0.50 美元。此外还提供更快速版本,Grok 3 加速版每百万输入 token 收费 5 美元,输出收费 25 美元;Grok 3 Mini 加速版每百万输入 token 收费 0.60 美元,输出收费 4 美元。
相比竞品,Grok 3 的价格并不便宜。它与同样提供推理能力的 Anthropic 的 Claude 3.7 Sonnet 价格持平,比最近发布的 Google Gemini 2.5 Pro 更贵,而后者在多个 AI 评测基准上的得分普遍高于 Grok 3(值得一提的是,xAI 曾被指控在 Grok 3 的基准测试报告中存在误导)。
正如一些 X 平台用户指出,xAI API 中的 Grok 3 的上下文窗口小于其声称的能力("上下文窗口"指模型一次可以处理的 token 数量)。API 最多支持 131,072 个 token(约 97,500 字),远低于 xAI 在二月底宣称的 Grok 3 可支持的 100 万 token。
当 Musk 大约两年前推出 Grok 时,他将这个 AI 模型定位为前卫、不加过滤且反"觉醒"的模型,总的来说愿意回答其他 AI 系统不会回答的争议性问题。他确实实现了部分承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然使用那些在 ChatGPT 中听不到的丰富多彩的措辞。
但在 Grok 3 之前的 Grok 模型在政治话题上比较谨慎,不会逾越某些界限。事实上,一项研究发现,在跨性别权利、多元化项目和不平等等话题上,Grok 倾向于政治左翼立场。
Musk 将这种行为归咎于 Grok 的训练数据——公开网页,并承诺要"让 Grok 更接近政治中立"。除了一些引人注目的错误,如短暂审查对特朗普总统和 Musk 不利的言论外,目前还不清楚 xAI 是否在模型层面实现了这一目标,以及这可能带来什么长期影响。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。