马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

马斯克旗下xAI开源了Grok-1，一个3140亿参数的混合专家模型，成为迄今为止参数量最大的开源LLM。Grok-1未针对特定任务微调，使用JAX和Rust自定义训练堆栈训练。项目在GitHub上迅速获得关注，马斯克借此讽刺OpenAI的开放性。Grok-1的开源可能推动AI技术的广泛采纳和快速发展，同时加入开源与闭源的辩论。

说到做到，马斯克xAI的Grok，果然如期开源了！

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

就在刚刚，xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。

3140亿的参数，让Grok-1成为迄今参数量最大的开源LLM，是Llama 2的4倍。

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

目前，xAI关于Grok-1没有透露更多信息。

官网放出的信息如下——

- 基础模型在大量文本数据上训练，未针对任何特定任务进行微调。

- 314B参数的MoE，有25%的权重在给定token上处于激活状态。

- 2023年10月，xAI使用JAX和Rust之上的自定义训练堆栈从头开始训练。

一经上线GitHub，Grok就狂揽了6k星，586个Fork。

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

项目地址：https://github.com/xai-org/grok-1

马斯克还不忘嘲讽OpenAI一番，「告诉我们更多关于OpenAI的「open」部分...」

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

纽约时报点评道，开源Gork背后的原始代码，是这个世界上最富有的人控制AI未来战斗的升级。

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

开源究竟会让技术更安全，还是会让它更滥用？

「开源支持者」马斯克，以身作则地卷入了AI界的这场激烈辩论，并用行动给出了答案。

小扎刚刚也对Grok做出了评价，「并没有给人留下真正深刻的印象，3140亿参数太多了，你需要一堆H100，不过我已经买下了」。

一条磁力链，全球首个最大模型开源

这次xAI开源Grok-1，遵守的是Apache-2.0许可证，因此，用户可以自由使用、修改和分发软件。

存储库包含了用于加载和运行Grok-1开源权重模型的JAX示例代码。

用户需要下载checkpoint，将ckpt-0目录放置在checkpoint中，随后运行以下代码来测试：

pip install -r requirements.txtpython run.py

这个脚本会在测试输入上，加载checkpoint和模型中的样本。

由于模型较大，参数达到了314B参数，因此需要具有足够GPU内存的计算机，才能使用示例代码测试模型。

而且，由于此存储库中MoE层的实现效率不高，选择该实现是为了避免需要自定义内核来验证模型的正确性。

通过Torrent客户端和下面这个磁力链接，就可以下载权重了。

magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

第一代Grok已超越Llama-2-70B

2023年11月，xAI推出了自己的第一代大语言模型Grok，正式加入大模型的战争。

当时，Grok在推特上作为「Premium+」订阅服务的一部分，月费16美元。

xAI表示，Grok的设计灵感来源于《银河系漫游指南》，它能够回答几乎所有问题，助力人类不分背景或政治立场地追求理解和知识。

Grok最初的版本Grok-0拥有330亿参数，紧接着xAI推出了经过数次改进的Grok-1，为X上的Grok聊天机器人提供支持。

根据xAI公布的数据，在GSM8K、HumanEval和MMLU等一系列基准测试中，Grok-1的表现超过了Llama-2-70B和GPT-3.5，虽然跟GPT-4还差得远。

当时，Grok不仅能够处理X平台上实时生成的用户内容，还带有一点幽默感，给憨憨的AI注入了一丝活力。

在提供最新热点事件信息（无论是政治还是体育）的同时，它还能抖个机灵，甚至偶尔讽刺一下。

马斯克为何选择开源？

在数次嘲讽OpenAI是「CloseAI」之后，马斯克果真选择了开源自家大模型。

当然，这背后肯定也有商业上的考量。

作为市场领导者的OpenAI，是没有理由开源ChatGPT背后模型代码的。

现在，通过发布Grok的代码，马斯克将自己牢牢扎根在后者的阵营中。这一决定，或许能让他的xAI超越Meta和Mistral AI。

Llama的开源给Meta带来了很多好处，几乎让小扎从元宇宙的泥潭爬了出来。

而仅仅只是一个小型初创公司的Mistral AI，也因为自己的开源策略而声名鹊起，被业界公认为「欧洲的OpenAI」。

开源版本可能会鼓励开发者和潜在客户更快地采纳自己的模型，实际上起到了市场推广的作用。

开发者社区对Grok开源版本的反馈和改进也可能有助于xAI加速开发新版本，这些新版本xAI可以选择开放源代码或保留专有权。

比如像Mistral一样，承诺继续发布开源版本，同时为付费客户保留最先进的模型。

马斯克一直是开源技术的支持者，连Tesla也已经开放了汽车某些部分的源代码，而他的社交媒体平台X公开了一些用于内容排名的算法。

「还有工作要做，但这个平台已经是迄今为止最透明、最注重真相、不是高门槛的平台，」马斯克今天在回应对开源X推荐算法的评论时，这样说道。

尽管OpenAI目前在AI领域仍遥遥领先，但开源和闭源的战争还远远没有结束。

AI模型是否应该开源？某些人认为，必须防止这种强大技术免受闯入者的侵害，而另一些人则坚持认为，开源的利绝对大于弊。

作为市场领导者的OpenAI，是没有理由开源ChatGPT背后模型代码的。

现在，通过发布Grok的代码，马斯克将自己牢牢扎根在后者的阵营中。

这一决定，或许能让他的xAI最终超越Meta和Mistral AI。

参考资料：

https://x.ai/blog/grok-os

https://twitter.com/itsandrewgao/status/1769447551374156097

https://www.wired.com/story/elon-musk-no-choice-open-chatbot-grok/

来源：传感器技术

0赞

好文章，需要你的鼓励

Albertsons借助Databricks构建零售商品智能决策平台

美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台，整合产品、定价、促销与陈列等决策功能，目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据，通过Unity Catalog与AI Gateway实现数据治理，并借助AI智能体Genie支持自然语言查询，帮助商家洞察销售趋势，提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。

阿里巴巴让AI图像生成模型“自我进化“：Qwen-Image-2.0-RL是如何让机器学会审美的？

人工智能

强化学习

图像生成优化

2026-06-30

阿里巴巴让AI图像生成模型“自我进化“：Qwen-Image-2.0-RL是如何让机器学会审美的？

阿里Qwen团队通过引入强化学习和在线策略蒸馏，将Qwen-Image-2.0升级为Qwen-Image-2.0-RL，让图像生成模型真正学会人类审美，文生图Elo评分提升78分，图像编辑提升93分。

人工智能

自然语言处理

智能体集成

2026-06-30

微软正式将 Windows 11 打造为 AI 操作系统

微软正将Windows 11打造成真正的AI操作系统。在Build大会上，微软展示了AI模型与智能代理如何深度融合进Windows 11，让用户通过自然语言完成系统操作。借助Windows ML框架，超过5亿台PC已可在本地离线运行AI任务，无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力，Adobe、WhatsApp、Canva等第三方也在积极跟进，企业级AI PC采购需求有望加速。

强化学习

流匹配生成模型

奖励过度优化

2026-06-30

港科大联手快手，让AI画图“减减肥“：一个让图像生成更真实的小技巧

港科大与快手联合提出NormGuard，针对流匹配模型强化学习训练中速度范数膨胀问题，通过训练时单向惩罚约束，在保留奖励的同时改善图像真实感。

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

更多细节

第一代Grok已超越Llama-2-70B

来源：传感器技术

人工智能

自然语言处理

优化模型

Albertsons借助Databricks构建零售商品智能决策平台

人工智能

强化学习

图像生成优化

阿里巴巴让AI图像生成模型“自我进化“：Qwen-Image-2.0-RL是如何让机器学会审美的？

人工智能

自然语言处理

智能体集成

微软正式将 Windows 11 打造为 AI 操作系统

强化学习

流匹配生成模型

奖励过度优化

港科大联手快手，让AI画图“减减肥“：一个让图像生成更真实的小技巧

2024

03/19

17:04

分享

点赞

传感器技术

制造业的未来是智能化，智能化的基础就是传感器；互联网的方向是物联网，物联网的基石也是传感器；关注传感器技术，获得技术资讯、产品应用、市场机会，掌握最黑科技，为中国工业导航。

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

更多细节

第一代Grok已超越Llama-2-70B

来源：传感器技术

2024

03/19

17:04

分享

点赞

传感器技术

制造业的未来是智能化，智能化的基础就是传感器； 互联网的方向是物联网，物联网的基石也是传感器； 关注传感器技术，获得技术资讯、产品应用、市场机会，掌握最黑科技，为中国工业导航。

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

制造业的未来是智能化，智能化的基础就是传感器；互联网的方向是物联网，物联网的基石也是传感器；关注传感器技术，获得技术资讯、产品应用、市场机会，掌握最黑科技，为中国工业导航。