阿里巴巴发布多模态Qwen3.5混合专家模型

阿里巴巴发布Qwen3.5人工智能模型，声称在某些任务上超越GPT-5.2和Claude 4.5 Opus。该开源模型采用专家混合架构，拥有3970亿参数，每次推理仅激活170亿参数，支持262,144个token的上下文长度。模型结合线性注意力机制和门控增量网络等优化技术，显著提升硬件效率。支持210多种语言和图像处理，在多项基准测试中表现优异。

阿里巴巴集团发布了一款人工智能模型，声称在某些任务上能够超越GPT-5.2和Claude 4.5 Opus。

这款名为Qwen3.5的新算法已在Hugging Face平台以开源许可证形式发布。

默认情况下，Qwen3.5能够处理多达262,144个Token的提示。开发者通过自定义配置可以将这一数量提升近四倍。提示内容可以包含超过210种语言和方言的文本，以及数据可视化等图像。

Qwen3.5采用混合专家模型架构，这意味着它由多个针对不同任务优化的神经网络组成。当大语言模型接收到提示时，它会使用其中10个神经网络来生成答案。仅激活模型的部分组件来处理提示，比让输入通过所有人工神经元更加节省硬件资源。Qwen3.5总共拥有3970亿个参数，其中每个提示使用170亿个参数。

阿里巴巴还为该模型配备了其他几种旨在提升效率的优化技术。

大语言模型的注意力头是用于确定在做决策时需要考虑哪些数据点的机制，通常呈二次方增长。这意味着将提示中的数据量翻倍，生成响应所需的RAM会增加四倍。Qwen3.5将标准的二次方注意力头与所谓的线性注意力头相结合，后者需要的内存要少得多。

该模型还使用了另一种名为门控增量网络的效率提升技术。这项技术结合了门控和增量规则这两种深度学习技术。

门控技术使大语言模型能够从内存中移除任务不需要的数据，从而降低硬件使用率。增量规则则是反向传播算法的一个版本，大语言模型在训练期间使用它来学习新任务。它简化了模型在学习过程中更新参数的方式。去年，英伟达研究人员确定，将这两种方法结合起来可以减少训练大语言模型所需的硬件数量。

阿里巴巴在30多个基准测试中将Qwen3.5与GPT-5.2和Claude 4.5 Opus进行了比较。该模型在IFBench测试中表现优于两者，这项测试衡量大语言模型遵循用户指令的能力。在其他情况下，Qwen3.5击败了其中一个大语言模型但未超过另一个。例如，它在HMMT推理基准上超过了Claude 4.5 Opus的得分，但落后于GPT-5.2。

阿里巴巴表示，Qwen3.5在处理多模态数据方面也很擅长。它在多个视觉推理和编程基准测试中超越了专门为图像分析任务构建的模型Qwen3-VL。

Q&A

Q1：Qwen3.5模型有什么特别之处？

A：Qwen3.5是阿里巴巴发布的混合专家模型，拥有3970亿个参数，支持超过210种语言和方言，能处理文本和图像等多模态数据，在某些任务上声称超越GPT-5.2和Claude 4.5 Opus。

Q2：混合专家模型架构有什么优势？

A：混合专家模型由多个针对不同任务优化的神经网络组成，处理提示时只激活其中10个神经网络，比运行所有人工神经元更节省硬件资源，提高了处理效率。

Q3：Qwen3.5在基准测试中表现如何？

A：在30多个基准测试中，Qwen3.5在IFBench指令遵循测试中超越了GPT-5.2和Claude 4.5 Opus，在其他测试中表现不一，有时超越其中一个但不如另一个模型。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

阿里巴巴发布多模态Qwen3.5混合专家模型

来源：SiliconANGLE

2026

02/17

14:03

分享

点赞

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

SaaS并未消亡，市场正转向混合模式发展

Java AI开发应用持续增长，Azul报告显示采用率上升

诺基亚预测广域网流量大幅增长但专家质疑假设

Eclipse投资3100万美元支持电动车交易平台Ever发展

AI系统面临四大关键漏洞攻击威胁

Gemini 3 Deep Think推出重大升级：推动科学研究与工程发展

NVIDIA DGX Spark助力全球高等教育AI研究突破

领先推理服务商采用NVIDIA Blackwell开源模型将AI成本降低10倍

思科推出102.4Tbps芯片，加速AI网络基础设施建设

生成式AI恐慌蔓延，商业地产服务公司股价集体暴跌

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: