DeepSeek 发布采用 MIT 许可证的改进版 V3 模型

DeepSeek发布了改进版DeepSeek-V3大语言模型，采用MIT开源许可证。新版本在编程能力上有所提升，可在高端Mac Studio上运行。模型具有671亿参数，但只激活约37亿参数，提高了效率。这一更新标志着DeepSeek在开源AI领域的重要进展，为开发者提供了更多灵活性和应用可能。

DeepSeek 今天发布了其 DeepSeek-V3 大语言模型的改进版本，并采用了新的开源许可证。

软件开发者兼博主 Simon Willison 率先报道了这一更新。DeepSeek 本身并未发布公告。新模型的 Readme 文件 (代码仓库中通常包含说明注释的组件) 目前仍是空白的。

DeepSeek-V3 是一个于去年 12 月首次亮相的开源大语言模型。它是 DeepSeek-R1 的基础，而 DeepSeek-R1 是一个推理模型，今年早些时候使这家中国人工智能实验室声名鹊起。DeepSeek-V3 是一个通用模型，并非专门针对推理进行优化，但它可以解决一些数学问题并生成代码。

在此之前，该大语言模型是在自定义开源许可证下发布的。DeepSeek 今天推出的新版本改用了广泛使用的 MIT 许可证。开发者几乎可以不受任何限制地在商业项目中使用和修改更新后的模型。

更值得注意的是，新版 DeepSeek-V3 似乎比原版更强大且硬件效率更高。

大多数最先进的大语言模型只能在数据中心的图形卡上运行。Apple Inc. 机器学习研究组的研究科学家 Awni Hannun 在 Mac Studio 上运行了新版 DeepSeek-V3。该模型能够以每秒约 20 个 token 的速率生成输出。

这台 Mac Studio 采用了售价 9,499 美元的高端配置。在该机器上部署 DeepSeek-V3 需要应用 4 位量化。这是一种大语言模型优化技术，通过牺牲一些输出精度来换取更低的内存使用和延迟。

根据 VentureBeat 发现的一条 X 平台帖子，新版 DeepSeek-V3 在编程方面比原版更出色。该帖子包含了一个评估模型生成 Python 和 Bash 代码能力的基准测试。新版本获得了约 60% 的得分，比原版 DeepSeek-V3 高出几个百分点。

该模型仍落后于 DeepSeek-R1 (该 AI 实验室的旗舰推理优化大语言模型)。最新的 DeepSeek-V3 版本的得分也低于另一个推理优化模型 Qwen-32B。

尽管 DeepSeek-V3 拥有 6,710 亿个参数，但在回答提示时只激活约 370 亿个参数。这种设计使模型比传统的激活所有参数的大语言模型需要更少的基础设施。据 DeepSeek 称，该大语言模型的效率也高于 DeepSeek-R1，这降低了推理成本。

原版 DeepSeek-V3 的训练数据集包含 14.8 万亿个 token。训练过程使用了约 280 万个显卡小时，显著低于前沿大语言模型通常所需的时间。为了提高模型的输出质量，DeepSeek 工程师使用来自 DeepSeek-R1 的提示响应对其进行了微调。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

DeepSeek 发布采用 MIT 许可证的改进版 V3 模型

来源：SiliconANGLE

2025

03/25

17:36

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Red Hat 简化 AI 应用训练和推理的数据访问流程

Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

OpenAI 爆火的吉卜力风格引发 AI 版权担忧

ETSI 发布首个后量子加密标准

ChatGPT 整合 GPT-4o 推出图像生成功能

让数据为 AI 做好准备的三个步骤

Imandra 新推出的 AI 编程助手 CodeLogician 利用"推理能力"确保代码准确性

微软为研究和数据分析推出"深度推理"版 Copilot AI

Amazon 推出 AI 智能购物助手，洞悉你的喜好

前英特尔 CEO Gelsinger 转投宗教科技公司 Gloo 任要职

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会