Alibaba 发布 Qwen 2.5-Max AI 模型，称性能超越 DeepSeek-V3

阿里云发布最新大语言模型 Qwen 2.5-Max，声称性能超越当前最强 AI 模型。该模型采用专家混合架构，经过 20 万亿 token 预训练和后续强化学习，在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务，但尚未开源。

阿里巴巴集团旗下的云计算部门阿里云在农历新年之际发布了其最新突破性的人工智能大语言模型：Qwen 2.5-Max，声称其性能超越了当今最强大的 AI 模型。

在过去两周内，这是继 DeepSeek 的 R1 推理模型之后中国发布的第二个重要大语言模型。中国 AI 研究初创公司 DeepSeek 此前声称，R1 模型能够与美国公司开发的最强大模型相媲美，且训练成本仅为后者的一小部分，这一说法引起了广泛关注。

阿里云在博客文章中表示："我们开发的 Qwen 2.5-Max 是一个大规模混合专家 LLM 模型，该模型已经在超过 20 万亿个 token 上进行了预训练，并通过精选的监督微调和基于人类反馈的强化学习方法进行了后续训练。"

混合专家模型 (MoE) 是一种大语言模型架构，它使用多个专门模型协同工作，根据特定的专业领域更高效地处理复杂任务。这就像一个 AI 模型团队，每个模型都在特定知识子类别中表现出色，它们共同合作，结合各自的训练来回答问题和完成任务。

据阿里巴巴称，使用这种技术的新 Qwen 模型在关键基准测试中超越了 DeepSeek-V3（该初创公司在去年 12 月底发布的最新非推理模型），包括 ArenaHard、LiveBench 和 MMLU-Pro。公司还声称其性能超过了 Anthropic 的 Claude 3.5 Sonnet、OpenAI 的 GPT-4 和 Meta 的 Llama 3.1-401B。

该架构还使公司能够以更小的资源消耗构建模型，仅需要 20 万亿个 token 进行训练。这使得模型部署时能够使用更少的资源，并以更高的效率运行。

阿里云表示："数据和模型规模的扩展不仅展示了模型智能的进步，也反映了我们在开创性研究方面的坚定承诺。我们致力于通过创新应用规模化强化学习来增强大语言模型的思维和推理能力。"

与其他开源的 Qwen 模型不同，Qwen 2.5-Max 目前仍是闭源的。阿里巴巴通过阿里云提供了与 OpenAI API 兼容的应用程序接口，方便开发者集成。用户还可以通过类似 ChatGPT 的聊天机器人界面 Qwen Chat 访问该模型。

阿里巴巴最近在去年 8 月还发布了新的视觉语言模型 Qwen2-VL。该模型具有先进的视频理解能力，可以处理长达 20 分钟的高质量视频并回答相关内容的问题。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Alibaba 发布 Qwen 2.5-Max AI 模型，称性能超越 DeepSeek-V3

来源：SiliconANGLE

2025

01/30

18:47

分享

点赞

从122TB QLC到本土端到端能力，Solidigm用长期主义服务中国客户

飞龙股份泰国罗勇工厂试生产，涡壳与电子水泵开启本地交付

极智嘉在丰田多个工厂部署逾400台自主移动机器人

自动驾驶卡车公司Einride正式登陆纳斯达克

Cyera完成6亿美元融资，估值达120亿美元，网络安全赛道迎来密集投资潮

纽约直面数据中心扩张浪潮：如何在发展与电网改革之间寻求平衡

DiffusionGemma发布：本地AI推理速度提升4倍

亚马逊完成债券发行后再向银行借款175亿美元，AI支出持续扩大

Hermes与Ollama组合：我测试过众多桌面AI工具后找到的新宠

罗技Mobi Fold折叠鼠标：颜值在线，握感略显局促

思科转型软件巨头的战略全景解析

F5推出AI驱动WAF与虚拟补丁技术，全面强化网络安全防护

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: