阿里巴巴集团发布了一款人工智能模型,声称在某些任务上能够超越GPT-5.2和Claude 4.5 Opus。
这款名为Qwen3.5的新算法已在Hugging Face平台以开源许可证形式发布。
默认情况下,Qwen3.5能够处理多达262,144个Token的提示。开发者通过自定义配置可以将这一数量提升近四倍。提示内容可以包含超过210种语言和方言的文本,以及数据可视化等图像。
Qwen3.5采用混合专家模型架构,这意味着它由多个针对不同任务优化的神经网络组成。当大语言模型接收到提示时,它会使用其中10个神经网络来生成答案。仅激活模型的部分组件来处理提示,比让输入通过所有人工神经元更加节省硬件资源。Qwen3.5总共拥有3970亿个参数,其中每个提示使用170亿个参数。
阿里巴巴还为该模型配备了其他几种旨在提升效率的优化技术。
大语言模型的注意力头是用于确定在做决策时需要考虑哪些数据点的机制,通常呈二次方增长。这意味着将提示中的数据量翻倍,生成响应所需的RAM会增加四倍。Qwen3.5将标准的二次方注意力头与所谓的线性注意力头相结合,后者需要的内存要少得多。
该模型还使用了另一种名为门控增量网络的效率提升技术。这项技术结合了门控和增量规则这两种深度学习技术。
门控技术使大语言模型能够从内存中移除任务不需要的数据,从而降低硬件使用率。增量规则则是反向传播算法的一个版本,大语言模型在训练期间使用它来学习新任务。它简化了模型在学习过程中更新参数的方式。去年,英伟达研究人员确定,将这两种方法结合起来可以减少训练大语言模型所需的硬件数量。
阿里巴巴在30多个基准测试中将Qwen3.5与GPT-5.2和Claude 4.5 Opus进行了比较。该模型在IFBench测试中表现优于两者,这项测试衡量大语言模型遵循用户指令的能力。在其他情况下,Qwen3.5击败了其中一个大语言模型但未超过另一个。例如,它在HMMT推理基准上超过了Claude 4.5 Opus的得分,但落后于GPT-5.2。
阿里巴巴表示,Qwen3.5在处理多模态数据方面也很擅长。它在多个视觉推理和编程基准测试中超越了专门为图像分析任务构建的模型Qwen3-VL。
Q&A
Q1:Qwen3.5模型有什么特别之处?
A:Qwen3.5是阿里巴巴发布的混合专家模型,拥有3970亿个参数,支持超过210种语言和方言,能处理文本和图像等多模态数据,在某些任务上声称超越GPT-5.2和Claude 4.5 Opus。
Q2:混合专家模型架构有什么优势?
A:混合专家模型由多个针对不同任务优化的神经网络组成,处理提示时只激活其中10个神经网络,比运行所有人工神经元更节省硬件资源,提高了处理效率。
Q3:Qwen3.5在基准测试中表现如何?
A:在30多个基准测试中,Qwen3.5在IFBench指令遵循测试中超越了GPT-5.2和Claude 4.5 Opus,在其他测试中表现不一,有时超越其中一个但不如另一个模型。
好文章,需要你的鼓励
机器人智能公司Inbolt将于2026年6月在芝加哥Automate展会上发布两项新能力:Inbolt机器人编程功能和扩展版机器人控制模块。新功能可让工程师直接基于CAD模型构建程序,结合视觉模型实时定位实体零件并自动调整运动路径,彻底消除传统调试中耗时数周的手动示教环节。此次更新还将原生支持安川机器人,使平台覆盖品牌扩展至六个。
卡内基梅隆大学提出MACU框架,让经理AI统筹多个员工AI并行完成复杂电脑操作任务,通过动态调整任务图,在四个基准上均超越单智能体。
本文提供了一套完整的笔记本电脑深度清洁方案。硬件方面,介绍了如何用温和洗涤剂清洁机身、用微纤维布擦拭屏幕、用压缩空气清理键盘及清洁充电线的正确方法。软件方面,建议及时更新操作系统与驱动程序,删除冗余文件与临时下载内容,并通过开启Windows Storage Sense功能实现自动清理,同时将剩余文件整理归类,保持系统整洁高效运行。
康奈尔大学提出SEIG框架,让视觉语言模型通过分阶段重建几何、材质、构图和灯光,从单张图片自动生成可编辑的Blender 3D场景。