DeepSeek 超越"开放权重"AI，计划发布源代码

DeepSeek 在上个月发布了一个开放权重的 AI 模型后，现在计划进一步开源其底层代码。公司将从下周开始发布五个开源仓库，涵盖其在线服务中的关键组件。这一举措将使 DeepSeek 的技术更加透明，有助于推动 AI 领域的集体进步，同时也与 OpenAI 等保持专有模型的公司形成对比。

上个月，DeepSeek 通过发布一个新的、具有竞争力的模拟推理模型，在 AI 领域掀起了轩然大波。该模型可以在 MIT 许可证下免费下载和使用。现在，该公司正准备让这个模型背后的底层代码更加透明，承诺从下周开始发布五个开源代码库。

在周四晚间的社交媒体帖子中，DeepSeek 表示，其计划的"开源周"每日发布将提供对"这些在我们在线服务中的基础模块的可见性，它们已经过文档记录、部署和生产环境的实战测试。作为开源社区的一份子，我们相信每一行共享的代码都将成为推动我们共同前进的动力。"

虽然 DeepSeek 对将要分享的代码类型并未具体说明，但其配套的 GitHub 页面 "DeepSeek Open Infra" 承诺即将发布的内容将涵盖"推动我们这个小小月球计划前进的代码"，并"完全透明地分享我们微小但真诚的进展"。该页面还引用了一份 2024 年的论文，详细介绍了 DeepSeek 的训练架构和软件栈。

这一举措可能会加大 DeepSeek 与 OpenAI 之间的差异，后者的市场领先产品 ChatGPT 模型仍然完全专有，其内部运作对外部用户和研究人员来说依然不透明。尽管 DeepSeek 的移动应用因隐私问题面临国际限制，但这次开源发布可能有助于提供更广泛和更便捷的访问途径。

开放究竟有多开放？

DeepSeek 最初的模型发布已经包含了所谓的"开放权重"访问权限，可以访问代表模型数十亿模拟神经元之间连接强度的底层数据。这种发布方式允许终端用户通过额外的训练数据轻松微调这些模型参数，以满足更具针对性的目的。

包括 Google 的 Gemma、Meta 的 Llama，甚至 OpenAI 早期发布的 GPT2 等主要模型都采用了这种开放权重结构。这些模型通常也会发布开源代码，涵盖响应查询时运行的推理时间指令。

目前尚不清楚 DeepSeek 计划的开源发布是否也将包括团队在训练模型时使用的代码。这种训练代码对于满足开源研究所 (OSI) 去年最终确定的"开源 AI"正式定义来说是必需的。根据 OSI 的标准，一个真正开放的 AI 还必须包括"关于用于训练系统的数据的充分详细信息，使得技术熟练的人能够构建一个实质上等效的系统"。

完全开源发布（包括训练代码）可以让研究人员更清楚地了解模型在核心层面是如何工作的，可能揭示出模型架构而非参数权重固有的偏见或局限性。完整的源代码发布还可以让人们更容易从头开始复制模型，如有必要，甚至可以使用全新的训练数据。

Elon Musk 的 xAI 在今年 3 月发布了 Grok 1 的开源推理时间代码版本，最近还承诺在未来几周内发布 Grok 2 的开源版本。但该公司表示，最近发布的 Grok 3 将暂时保持专有状态，仅供 X Premium 订阅用户使用。

本月早些时候，HuggingFace 在 OpenAI 发布专有的 "Deep Research" 功能几小时后就发布了其开源克隆版本。HuggingFace 的 Aymeric Roucher 告诉 Ars Technica，该克隆版本在发布时使用闭源权重模型"仅仅是因为它运行良好"，但源代码的"开放管道"可以根据需要轻松切换到任何开放权重模型。

来源：Arstechnica

0赞

好文章，需要你的鼓励

DeepSeek 超越"开放权重"AI，计划发布源代码

来源：Arstechnica

2025

02/24

16:41

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: