阿里巴巴最新 Qwen3 模型宣称引领 AI 推理技术

阿里巴巴推出全新 Qwen3 系列人工智能模型，采用混合专家技术在编码、数学和推理测试中超越部分美国顶级模型，支持119种语言，助力实现超越人类智慧的通用人工智能目标。

阿里巴巴集团有限公司宣布推出新的人工智能模型系列 Qwen3，据称其性能可超越来自 OpenAI 和 Google LLC 等公司的竞争模型。

这一新产品的发布突显了自 DeepSeek Ltd. 在去年年底首次亮相以来，中国人工智能行业迅速发展的步伐。

新款 Qwen3 模型在多个领域，例如编码和数学问题上，均优于 DeepSeek 最佳模型。它将以开源许可证发布多个 Qwen3 系列模型，这些模型的参数数量范围从 600 million 到 235 billion 参数不等，参数数量大致反映了解决问题的能力。一般来说，模型参数越多，性能表现就越好。

在新推出的 Qwen3 系列中，有两款采用所谓 "mixture of experts" ( MoE ) 技术的模型，阿里巴巴表示其可以与 Google 和 Anthropic PBC 推出的最先进推理模型相媲美。推理模型旨在模仿人类思考问题的方式，花更多时间进行思考并执行事实核查以确保准确性。

通过采用 MoE 技术，人工智能模型可以通过将任务划分为更小的部分来增强其推理能力，这类似于一家公司派遣专门团队针对更具挑战性的问题的特定部分进行处理。将任务分摊至模型的不同部分，使问题解决过程更加高效。

阿里巴巴 Qwen 团队在一篇博客文章中表示：“我们已将思考模式与非思考模式无缝集成，为用户提供灵活控制思考预算的能力。这一设计使用户能够更轻松地配置针对特定任务的预算。”

阿里巴巴表示，Qwen3 模型支持 119 种语言，并在一个包含近 36 trillion Token 的数据集上进行了训练，这些 Token 是它们在接受“教学”过程中处理的基本数据单位。1 million Token 大约相当于 750,000 个单词，在本案例中，这些数据来自各种教材、代码片段、AI 生成的数据、问答对以及其它资源。

在各项基准测试中，阿里巴巴的 Qwen3 模型展现出了令人印象深刻的表现，超越了美国 AI 公司近期推出的“高端”模型，如 OpenAI 的 o3-mini 和 o4-mini 模型。

例如，在衡量模型编写代码能力的 Codeforces 基准测试中，最大的 Qwen-3-235B-A22B 模型超越了 o3-mini 以及 Google 的 Gemini 2.5 Pro 模型。它还在 AIME 数学基准测试以及评估 AI 模型推理能力的 BFCL 测试中击败了 o3-mini。

自从 DeepSeek 的 R1 推理模型在去年 12 月末首次亮相以来，虽然其开发成本仅为 OpenAI 的一小部分，却已抢占风头，此后中国科技领袖陆续推出了一系列同样强大的 AI 模型。阿里巴巴几周前刚推出了 Qwen-2.5 系列模型，并称这些模型可以处理包括文本、图像、音频和视频在内的多模态数据格式。这些模型显著轻量，设计上可直接在智能手机和笔记本电脑上运行。

强大且开源的中国 AI 模型的出现，提升了美国 AI 公司的竞争压力，尽管它们直到最近还被视为行业领导者。但如今，美国模型的地位正受到威胁，尤其是因为美国制造的模型通常在训练上投入的成本远高于中国同行。

在其最近的一次举动中，美国对 Nvidia Corp. 的 H20 GPU 实施了出口许可证，这款 GPU 专门设计以符合之前对中国的制裁规定。

OpenAI 则回应称，将在未来几个月内推出一种 “open-weights” 推理模型，这标志着其一贯将模型内部工作原理视为“黑盒”策略的巨大转变。

阿里巴巴首席执行官吴泳铭在二月份表示，该公司的主要目标是构建一个“通用人工智能”系统，最终能够超越人类的智力水平。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

阿里巴巴最新 Qwen3 模型宣称引领 AI 推理技术

来源：SiliconANGLE

2025

04/29

16:39

分享

点赞

Uber年度遗失物报告揭示：数千件物品遗留在无人驾驶出租车中

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

ChatGPT 冲击 Google 在线购物领域

AI 治疗师来了：你需要了解的 14 欠突破性心理健康工具

Nvidia 推出 DOCA Argus ，将实时威胁检测引入 AI 基础设施

DeepSeek 成功证明：动力是 AI 创新的关键

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

思科在 RSAC 2025 展示新一代基于 AI 的安全创新 以应对日益复杂的威胁

代理正来临 – 关于我们接下来将如何与 AI 合作伙伴共事的更多探讨

Writer 推出 Palmyra X5，以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Gmail 在 Android 平板上新增滑动调整功能，侧边引入 AI

镜中陷阱：AI 伦理与人类想象力的崩溃

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

思科在 RSAC 2025 展示新一代基于 AI 的安全创新以应对日益复杂的威胁