亿万富翁 Elon Musk 虽然刚刚被 OpenAI 提起反诉,但这并没有阻止他的 AI 公司 xAI 推出其旗舰产品 Grok 3 模型的 API 服务。
在 xAI 发布 Grok 3 已经过去数月,该模型是公司对标 OpenAI 的 GPT-4 和 Google 的 Gemini 的产品。Grok 3 具备图像分析和问答能力,为 Musk 的社交网络 X(该平台在三月收购了 xAI)提供了多项功能支持。
xAI 在其 API 中提供两个版本的 Grok 3:标准版 Grok 3 和具备"推理"能力的 Grok 3 Mini。
Grok 3 的定价为:输入每百万 token (约 75 万字) 收费 3 美元,模型生成每百万 token 收费 15 美元。Grok 3 Mini 则是每百万输入 token 收费 0.30 美元,每百万输出 token 收费 0.50 美元。此外还提供更快速版本,Grok 3 加速版每百万输入 token 收费 5 美元,输出收费 25 美元;Grok 3 Mini 加速版每百万输入 token 收费 0.60 美元,输出收费 4 美元。
相比竞品,Grok 3 的价格并不便宜。它与同样提供推理能力的 Anthropic 的 Claude 3.7 Sonnet 价格持平,比最近发布的 Google Gemini 2.5 Pro 更贵,而后者在多个 AI 评测基准上的得分普遍高于 Grok 3(值得一提的是,xAI 曾被指控在 Grok 3 的基准测试报告中存在误导)。
正如一些 X 平台用户指出,xAI API 中的 Grok 3 的上下文窗口小于其声称的能力("上下文窗口"指模型一次可以处理的 token 数量)。API 最多支持 131,072 个 token(约 97,500 字),远低于 xAI 在二月底宣称的 Grok 3 可支持的 100 万 token。
当 Musk 大约两年前推出 Grok 时,他将这个 AI 模型定位为前卫、不加过滤且反"觉醒"的模型,总的来说愿意回答其他 AI 系统不会回答的争议性问题。他确实实现了部分承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然使用那些在 ChatGPT 中听不到的丰富多彩的措辞。
但在 Grok 3 之前的 Grok 模型在政治话题上比较谨慎,不会逾越某些界限。事实上,一项研究发现,在跨性别权利、多元化项目和不平等等话题上,Grok 倾向于政治左翼立场。
Musk 将这种行为归咎于 Grok 的训练数据——公开网页,并承诺要"让 Grok 更接近政治中立"。除了一些引人注目的错误,如短暂审查对特朗普总统和 Musk 不利的言论外,目前还不清楚 xAI 是否在模型层面实现了这一目标,以及这可能带来什么长期影响。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。