亿万富翁 Elon Musk 虽然刚刚被 OpenAI 提起反诉,但这并没有阻止他的 AI 公司 xAI 推出其旗舰产品 Grok 3 模型的 API 服务。
在 xAI 发布 Grok 3 已经过去数月,该模型是公司对标 OpenAI 的 GPT-4 和 Google 的 Gemini 的产品。Grok 3 具备图像分析和问答能力,为 Musk 的社交网络 X(该平台在三月收购了 xAI)提供了多项功能支持。
xAI 在其 API 中提供两个版本的 Grok 3:标准版 Grok 3 和具备"推理"能力的 Grok 3 Mini。
Grok 3 的定价为:输入每百万 token (约 75 万字) 收费 3 美元,模型生成每百万 token 收费 15 美元。Grok 3 Mini 则是每百万输入 token 收费 0.30 美元,每百万输出 token 收费 0.50 美元。此外还提供更快速版本,Grok 3 加速版每百万输入 token 收费 5 美元,输出收费 25 美元;Grok 3 Mini 加速版每百万输入 token 收费 0.60 美元,输出收费 4 美元。
相比竞品,Grok 3 的价格并不便宜。它与同样提供推理能力的 Anthropic 的 Claude 3.7 Sonnet 价格持平,比最近发布的 Google Gemini 2.5 Pro 更贵,而后者在多个 AI 评测基准上的得分普遍高于 Grok 3(值得一提的是,xAI 曾被指控在 Grok 3 的基准测试报告中存在误导)。
正如一些 X 平台用户指出,xAI API 中的 Grok 3 的上下文窗口小于其声称的能力("上下文窗口"指模型一次可以处理的 token 数量)。API 最多支持 131,072 个 token(约 97,500 字),远低于 xAI 在二月底宣称的 Grok 3 可支持的 100 万 token。
当 Musk 大约两年前推出 Grok 时,他将这个 AI 模型定位为前卫、不加过滤且反"觉醒"的模型,总的来说愿意回答其他 AI 系统不会回答的争议性问题。他确实实现了部分承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然使用那些在 ChatGPT 中听不到的丰富多彩的措辞。
但在 Grok 3 之前的 Grok 模型在政治话题上比较谨慎,不会逾越某些界限。事实上,一项研究发现,在跨性别权利、多元化项目和不平等等话题上,Grok 倾向于政治左翼立场。
Musk 将这种行为归咎于 Grok 的训练数据——公开网页,并承诺要"让 Grok 更接近政治中立"。除了一些引人注目的错误,如短暂审查对特朗普总统和 Musk 不利的言论外,目前还不清楚 xAI 是否在模型层面实现了这一目标,以及这可能带来什么长期影响。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。