阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言，采用混合思考模式，可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等，在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品，且大部分模型将通过 Hugging Face 和 GitHub 开放下载。

中国科技公司阿里巴巴于周一发布了 Qwen 3 系列 AI 模型，该公司声称这些模型在某些情况下可以与 Google 和 OpenAI 提供的最佳模型媲美甚至超越它们。

大多数模型目前已经或将很快可通过 AI 开发平台 Hugging Face 和 GitHub 在 “open” 许可下下载。它们的参数规模从 6 亿到 2350 亿不等。参数大致对应模型解决问题的能力，通常参数越多，模型的表现越好。

像 Qwen 这样由中国发展起来的模型系列的崛起，加大了对像 OpenAI 这样的美国实验室提供更强大 AI 技术的压力。同时，这也促使政策制定者实施限制措施，以限制中国 AI 公司获取训练模型所需芯片的能力。

据阿里巴巴介绍， Qwen 3 模型是 “混合式” 模型，这意味着它们既可以花费较长时间 “推理” 解决复杂问题，也可以快速响应简单请求。推理使得这些模型能够有效地自我核查，与 OpenAI 的 o3 等模型类似，但代价是较高的延迟。

Qwen 团队在博客中写道：“我们已将思考模式与非思考模式无缝整合，为用户提供了灵活的思考预算控制选项。此设计使用户能够更轻松地配置针对具体任务的预算。”

阿里巴巴表示， Qwen 3 模型支持 119 种语言，并在近 36 万亿个 Token 的数据集上进行了训练。Token 是模型处理的原始数据单位； 100 万个 Token 约等于 75 万个单词。阿里巴巴称， Qwen 3 的训练数据包括教科书、“question-answer pairs”、代码片段、 AI 生成的数据等多种内容。

阿里巴巴表示，这些改进以及其他优化大幅提升了 Qwen 3 相较于前作 Qwen 2 的性能。在编程比赛平台 Codeforces 上，最大的 Qwen 3 模型 —— Qwen-3-235B-A22B —— 刚刚超越了 OpenAI 的 o3-mini 与 Google 的 Gemini 2.5 Pro。Qwen-3-235B-A22B 在最新版本的 AIME （一个具有挑战性的数学基准测试）和 BFCL （一项评估模型 “推理” 问题能力的测试）中也超越了 o3-mini。

但 Qwen-3-235B-A22B 尚未公开发布 —— 至少目前还没有。

最大的公开 Qwen 3 模型 Qwen3-32B 仍与多种专有及开放的 AI 模型保持竞争优势，包括中国 AI 实验室 DeepSeek 的 R1。Qwen3-32B 在包括编码基准测试 LiveCodeBench 在内的多个测试中均超过了 OpenAI 的 o1 模型。

阿里巴巴表示， Qwen 3 在调用工具能力、遵循指令以及复制特定数据格式方面表现 “出色”。除了可供下载的模型外， Qwen 3 还可以通过云服务提供商 Fireworks AI 和 Hyperbolic 获得。

AI 云托管服务 Baseten 的联合创始人兼 CEO Tuhin Srivastava 表示， Qwen 3 是开放模型在追赶 OpenAI 等封闭系统趋势中的又一里程碑。

他在给 TechCrunch 的声明中表示：“美国正在加大对向中国销售芯片和从中国采购的限制，但像 Qwen 3 这样既先进又开放 [ … ] 的模型无疑将被国内使用。它反映出企业既在自主开发工具 [ as well as ] 也在通过 Anthropic 和 OpenAI 等封闭模型公司购买现成产品的现实。”

来源：Techcrunch

0赞

好文章，需要你的鼓励

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

来源：Techcrunch

2025

04/29

16:21

分享

点赞

手机里的NPU越来越强，为什么AI体验还在原地踏步？

如何使用现有基础设施让数据做好AI准备

Anthropic CEO警告AI行业泡沫化，批评"YOLO"式投资

雅虎利用AI实时总结橄榄球比赛精彩内容

押注AI智能体，奇奇科技跨越十年的“换挡”与远航

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖，引领个人AI体验创新

豆包手机助手调整部分AI能力 呼吁保障用户AI使用权

私有化云端：私有云和主权云的崛起

测评：Sotsu FlipAction便携显示器为何成为我iPad Pro和Mac的最佳第二屏幕

中兴通讯首席发展官崔丽在《经济学人》AI亚洲创新峰会分享智能体AI战略

Snowflake携手Anthropic推进智能体AI战略部署

Anthropic与Snowflake签署2亿美元合作协议，将大语言模型引入企业客户

ChatGPT 冲击 Google 在线购物领域

AI 治疗师来了：你需要了解的 14 欠突破性心理健康工具

Nvidia 推出 DOCA Argus ，将实时威胁检测引入 AI 基础设施

DeepSeek 成功证明：动力是 AI 创新的关键

思科在 RSAC 2025 展示新一代基于 AI 的安全创新 以应对日益复杂的威胁

代理正来临 – 关于我们接下来将如何与 AI 合作伙伴共事的更多探讨

Writer 推出 Palmyra X5，以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Gmail 在 Android 平板上新增滑动调整功能，侧边引入 AI

镜中陷阱：AI 伦理与人类想象力的崩溃

人工智能在航空航天产业中是否获准起飞？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

豆包手机助手调整部分AI能力呼吁保障用户AI使用权

思科在 RSAC 2025 展示新一代基于 AI 的安全创新以应对日益复杂的威胁