高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

阿里巴巴开源了320亿参数的大语言模型Qwen1.5-32B，性能略超Mixtral 8×7B MoE，略低于720亿参数的Qwen-1.5-72B。Qwen1.5-32B具有高性价比，显存需求减半，适合更广泛使用。模型在多项评测中表现优秀，特别是在推理和数学方面。支持32K上下文长度，以通义千问的开源协议发布，允许商用。

阿里巴巴最新开源了320亿参数的大语言模型Qwen1.5-32B，这个模型在各项评测结果中都略超此前最强开源大模型Mixtral 8×7B MoE，比720亿参数的Qwen-1.5-72B模型略差。但是一半的参数意味着只有一半的显存，这样的性价比极高。

高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

Qwen1.5-32B简介
Qwen1.5-32B模型的评测结果
Qwen1.5-32B模型的上下文长度
Qwen1.5-32B模型的开源地址和演示地址

Qwen1.5-32B简介

Qwen系列大语言模型是阿里巴巴开源的一系列大语言模型，在各项评测和应用中都取得了非常好的效果，也引起了非常多的人的关注。而且Qwen系列模型不仅仅是在国内很有名，在全球的大模型开源领域都有着很好的吸引力。本次开源的320亿参数模型是最新的一个。

Qwen1.5可以理解为Qwen2的beta版本，在此前开源了6个不同参数规模的Qwen1.5模型，最小的只有5亿参数，最大的是720亿参数。其中，Qwen1.5-72B是目前MT-Bench测评中仅次于GPT-4的模型，也是开源模型中得分最高的模型（MT-Bench采用了真实的多轮对话数据集）。而在匿名投票评测中（LMSYS推出的Areno评测系统，该评测为用户提供不同模型的匿名回复，由用户投票谁好谁好），Qwen1.5-72B也是开源模型中最强的。

不过720亿参数的Qwen1.5-72B的半精度模型需要144GB显存才能载入，单个显卡无法使用，因此很多人也无法体验。而此次发布的Qwen1.5-32B模型的参数只有Qwen1.5-72B模型参数的一半，显存也只有它的一半。官方提供的Int4版本模型仅需要20G显存，可以在4090显卡上推理，但实测速度较慢！。所以，消费级显卡在做这种规模参数模型的推理上还是比较差的。

而从评测结果看，Qwen1.5-32B比Qwen1.5-72B性能损失很小，而显存降低了一半，所以非常有性价比。

阿里巴巴官方说，最近几个月，通义千问模型在后训练上取得了进展，即在基于人类反馈的强化学习对齐训练方面有了很好的进步。而这个Qwen1.5-32B模型就是这个进步的成果。而Qwen1.5-32B模型本身和其它1.5版本的Qwen模型架构没有区别，不过多了一个 grouped query attention (GQA)，因此，推理的效率应该更高。

官方发布的Qwen1.5-32B包含5个版本：

高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

Qwen1.5-32B模型的评测结果

根据官方的描述，Qwen1.5-32B模型在300亿参数规模的模型中评测中非常靠前。虽然不能说第一，但各项成绩都很优秀。

而根据DataLearnerAI收集的全球主流模型评测结果上，Qwen1.5-32B接近此前发布的DBRX模型（ https://www.datalearner.com/ai-models/pretrained-models/DBRX-Instruct ），这是一个1320亿参数的MoE模型（激活时使用360亿参数）：

数据来源：https://www.datalearner.com/ai-models/llm-evaluation

上图是按照MMLU评分从上往下排序的结果。从上图可以看到，Qwen1.5-32B超过了Grok-1，略低于DBRX模型。但是总体上比李开复旗下公司开源的Yi-34B也要略差。详细的数据如下：

高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

尽管综合理解能力MMLU得分，Qwen1.5-32B并不算优秀，但是涉及到推理和数学方面（GSM8K、Math），则比其它300亿参数模型提升明显，只是略低于Qwen1.5-72B模型。

Qwen1.5-32B模型的上下文长度

官方提到了它支持32K上下文长度输入，在“大海捞针”测试中表现很好。

Qwen1.5-32B模型的开源地址和演示地址

Qwen1.5-32B模型本身以通义千问的开源协议开源，允许商用，也有在线测试，具体开源地址和在线测试地址参考DataLearnerAI的Qwen1.5-32B模型信息卡：https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-32B

来源：DataLearner

0赞

好文章，需要你的鼓励

高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

Qwen1.5-32B简介

Qwen1.5-32B模型的评测结果

Qwen1.5-32B模型的上下文长度

Qwen1.5-32B模型的开源地址和演示地址

来源：DataLearner

人工智能

大语言模型

市场泡沫

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

人工智能

音频驱动动画

多目标优化

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

人工智能

自然语言处理

混合架构优化

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

人工智能

内存优化

算法创新

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

2024

04/07

19:04

分享

点赞

DataLearner

关注数据科学关注科技行业关注人工智能关注一切促进人类生活美好的新技术

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

高产的阿里！Qwen1.5系列再次更新：阿里开源320亿参数Qwen1.5-32B，评测超Mixtral MoE，性价比更高！

Qwen1.5-32B简介

Qwen1.5-32B模型的评测结果

Qwen1.5-32B模型的上下文长度

Qwen1.5-32B模型的开源地址和演示地址

来源：DataLearner

2024

04/07

19:04

分享

点赞

DataLearner

关注数据科学 关注科技行业 关注人工智能 关注一切促进人类生活美好的新技术

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

关注数据科学关注科技行业关注人工智能关注一切促进人类生活美好的新技术