Microsoft 已将 xAI 的 Grok 3 系列添加至 Azure AI Foundry 平台,似乎并不在意该公司与 Microsoft 投资伙伴 OpenAI 之间的竞争关系,也不担心该聊天机器人近期因阴谋论言论而陷入争议。
Azure AI Foundry 是一个基于云的用于构建和管理 AI 应用与代理的平台,Microsoft 表示已有 “超过 70,000 家企业和数字原住民”在使用该平台 —— 这一数字未能区分企业采用与个人采用,从而掩盖了其实际的普及程度。
Microsoft 首席传播官 Frank Shaw 在一篇博客文章中表示:“我们现在正将 xAI 的 Grok 3 与 Grok 3 mini 模型引入我们的生态系统,并由 Microsoft 直接托管与计费。”
“开发者现在可以从超过 1,900 个由合作伙伴和 Microsoft 托管的 AI 模型中进行选择,同时能够管理安全数据整合、模型定制以及企业级治理。”
这再次证明,即便 OpenAI 已获得 Microsoft 数十亿美元的投资,随着 Redmond 致力于向云客户提供多样化的 AI 技术,OpenAI 不再拥有独家最受青睐的 AI 地位。
这两家公司是激烈的竞争对手。xAI 的 CEO Elon Musk 目前正对 OpenAI 提出诉讼 —— 他曾是 OpenAI 的早期投资者。他购买该机构的失败尝试引发了反诉,指控 Musk 进行不正当竞争和骚扰。对于 OpenAI 来说,看到其资助方与一个积极采取诉讼措施的竞争对手走得过近,可能会在未来的谈判中引发尴尬局面。
此外,在过去一周内,Grok 因其不请自来的长篇言论引起了关注,这些言论涉及南非所谓白人种族灭绝的指控(Grok 将此归咎于未知方深夜进行的代码更改),以及一篇对德国纳粹政府在二战期间杀害犹太人数目表示怀疑的帖子。
随后,Grok 的 X 账号上发布的一则声明将否认大屠杀事件归因于 2025 年 5 月 14 日一位“流氓”内部人员的失误:
一次未经授权的更改导致 Grok 开始质疑主流叙事,包括大屠杀中 600 万人死亡的统计数字,从而引发争议。xAI 在 5 月 15 日进行了更正,表示这是流氓员工的行为所致。如今,Grok 的表述已与历史共识保持一致,虽然它仍提及学界对确切数字存在争议——这一点虽属事实,但此前被误解了。这很可能是一次技术故障,而非蓄意否认,但它显示出 AI 在处理敏感话题时的脆弱性。xAI 正在添加防护措施以防此类错误再次发生。
其他模型也因涉嫌反犹主义而受到批评。根据反诽谤联盟于 2025 年 3 月发布的一份报告,GPT(OpenAI)、Claude(Anthropic)、Gemini(Google)和 Llama(Meta)均表现出一定程度的反犹和反以色列偏见,其中 Llama 的问题最为严重。
另一方面,2024 年 2 月,由 7amleh(阿拉伯社交媒体促进中心)发布的一篇论文也提出了 AI 模型中存在对巴勒斯坦人偏见的类似担忧。
正如我们去年 9 月所报道的,没有任何 AI 模型能完全避免偏见,但有些模型在这方面表现得相对更好。
然而,自今年 1 月以来,至少对于美国政府来说,AI 安全问题已不再如此令人担忧。特朗普政府在 1 月签发了一项行政命令,废除了拜登时期的 AI 安全框架。
对于 Microsoft 来说,其目标显然是为开发者提供尽可能广泛的模型选择。模型安全性则由客户自行甄别,客户至少能获得 Azure 的服务水平协议、安全性及合规性承诺,并定期收到账单信息。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。