Grok是马斯克旗下公司xAI在去年11月发布的,一款类ChatGPT产品,可以提供生成文本、代码、邮件、信息检索等功能。其测试性能超过GPT-3.5、LLaMA 2 70B,弱于GPT-4。
目前,该产品仅为X Premium+客户提供服务,至今没有大范围对外开放使用非常神秘。

Grok简单介绍
根据xAI在官网公布的早期模型卡显示,首先开发团队先训练了一个330亿参数的原始大模型Grok-0,其性能相当于700亿参数的LLaMA 2,但仅使用其一半的训练资源。
然后基于Grok-0进行蒸馏、微调开发了Grok-1,在GSM8k、MMLU、HumanEval等多个测试平台显示,其性能全面超过了LLaMA 2-70B、GPT-3.5。但与Claude 2、GPT-4还有较大的距离。

由于这些基准测试是公开的,Grok-1的训练数据可能已经包含了测试答案。
随后,开发团队使用了2023年匈牙利全国高中决赛的数学题对Grok-1、Claude 2、GPT-4进行了人工测试。
结果显示,Grok-1 以 C (59%) 的成绩通过了考试,而 Claude-2取得了差不多的成绩 (55%),GPT-4 以 68% 的成绩获得了B,其推理能力还是挺不错的。

训练数据方面,Grok-1 发布版本所使用的训练数据截至 2023 年第三季度的互联网数据以及xAI人工智能导师提供的数据。

局限性,虽然 Grok-1 在信息处理方面表现出色,但需要对 Grok-1生成的内容进行审核。Grok-1 语言模型不具备独立搜索网络的能力,不是一个多模态的产品。
马斯克为什么开源Grok
本月初,马斯克正式起诉了OpenAI以及其联合创始人Sam Altman和Greg Brockman。
原因是,OpenAI违反合同协议、违反信托义务和不公平的商业行为,在发布ChatGPT等爆火产品后转向闭源并开始盈利。这与最初的开放AI造福人类理念截然相反。
马斯克作为OpenAI最初创始人之一,表示Altman 和 Brockman 在 2015 年说服他帮助创立OpenAI并为其提供资金,同时承诺该公司将是一家非营利性AI研究机构,专注于对抗来自谷歌等科技公司的竞争。诉讼称,基于创始协议要求 OpenAI 向公众 免费提供 其技术成果。
但根据OpenAI最新发布的回应邮件来看,为了更好的开发AGI,获取更多资金壮大产品线走营利模式,当时马斯克是同意的。
所以,马斯克在这个时间点选择开源Grok,估计和前几天起诉OpenAI的案件有关,兑现自己当年联合创立OpenAI时的“开源”诺言。
关于xAI
xAI成立于2023年7月13日,隶属于马斯克旗下。其核心团队成员曾经分别在DeepMind、OpenAI、谷歌研究、微软研究、特斯拉等前沿公司或多伦多大学等学术机构任职过。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。