亿万富翁 Elon Musk 虽然刚刚被 OpenAI 提起反诉,但这并没有阻止他的 AI 公司 xAI 推出其旗舰产品 Grok 3 模型的 API 服务。
在 xAI 发布 Grok 3 已经过去数月,该模型是公司对标 OpenAI 的 GPT-4 和 Google 的 Gemini 的产品。Grok 3 具备图像分析和问答能力,为 Musk 的社交网络 X(该平台在三月收购了 xAI)提供了多项功能支持。
xAI 在其 API 中提供两个版本的 Grok 3:标准版 Grok 3 和具备"推理"能力的 Grok 3 Mini。
Grok 3 的定价为:输入每百万 token (约 75 万字) 收费 3 美元,模型生成每百万 token 收费 15 美元。Grok 3 Mini 则是每百万输入 token 收费 0.30 美元,每百万输出 token 收费 0.50 美元。此外还提供更快速版本,Grok 3 加速版每百万输入 token 收费 5 美元,输出收费 25 美元;Grok 3 Mini 加速版每百万输入 token 收费 0.60 美元,输出收费 4 美元。
相比竞品,Grok 3 的价格并不便宜。它与同样提供推理能力的 Anthropic 的 Claude 3.7 Sonnet 价格持平,比最近发布的 Google Gemini 2.5 Pro 更贵,而后者在多个 AI 评测基准上的得分普遍高于 Grok 3(值得一提的是,xAI 曾被指控在 Grok 3 的基准测试报告中存在误导)。
正如一些 X 平台用户指出,xAI API 中的 Grok 3 的上下文窗口小于其声称的能力("上下文窗口"指模型一次可以处理的 token 数量)。API 最多支持 131,072 个 token(约 97,500 字),远低于 xAI 在二月底宣称的 Grok 3 可支持的 100 万 token。
当 Musk 大约两年前推出 Grok 时,他将这个 AI 模型定位为前卫、不加过滤且反"觉醒"的模型,总的来说愿意回答其他 AI 系统不会回答的争议性问题。他确实实现了部分承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然使用那些在 ChatGPT 中听不到的丰富多彩的措辞。
但在 Grok 3 之前的 Grok 模型在政治话题上比较谨慎,不会逾越某些界限。事实上,一项研究发现,在跨性别权利、多元化项目和不平等等话题上,Grok 倾向于政治左翼立场。
Musk 将这种行为归咎于 Grok 的训练数据——公开网页,并承诺要"让 Grok 更接近政治中立"。除了一些引人注目的错误,如短暂审查对特朗普总统和 Musk 不利的言论外,目前还不清楚 xAI 是否在模型层面实现了这一目标,以及这可能带来什么长期影响。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。