阿里巴巴集团旗下的云计算部门阿里云在农历新年之际发布了其最新突破性的人工智能大语言模型:Qwen 2.5-Max,声称其性能超越了当今最强大的 AI 模型。
在过去两周内,这是继 DeepSeek 的 R1 推理模型之后中国发布的第二个重要大语言模型。中国 AI 研究初创公司 DeepSeek 此前声称,R1 模型能够与美国公司开发的最强大模型相媲美,且训练成本仅为后者的一小部分,这一说法引起了广泛关注。
阿里云在博客文章中表示:"我们开发的 Qwen 2.5-Max 是一个大规模混合专家 LLM 模型,该模型已经在超过 20 万亿个 token 上进行了预训练,并通过精选的监督微调和基于人类反馈的强化学习方法进行了后续训练。"
混合专家模型 (MoE) 是一种大语言模型架构,它使用多个专门模型协同工作,根据特定的专业领域更高效地处理复杂任务。这就像一个 AI 模型团队,每个模型都在特定知识子类别中表现出色,它们共同合作,结合各自的训练来回答问题和完成任务。
据阿里巴巴称,使用这种技术的新 Qwen 模型在关键基准测试中超越了 DeepSeek-V3(该初创公司在去年 12 月底发布的最新非推理模型),包括 ArenaHard、LiveBench 和 MMLU-Pro。公司还声称其性能超过了 Anthropic 的 Claude 3.5 Sonnet、OpenAI 的 GPT-4 和 Meta 的 Llama 3.1-401B。
该架构还使公司能够以更小的资源消耗构建模型,仅需要 20 万亿个 token 进行训练。这使得模型部署时能够使用更少的资源,并以更高的效率运行。
阿里云表示:"数据和模型规模的扩展不仅展示了模型智能的进步,也反映了我们在开创性研究方面的坚定承诺。我们致力于通过创新应用规模化强化学习来增强大语言模型的思维和推理能力。"
与其他开源的 Qwen 模型不同,Qwen 2.5-Max 目前仍是闭源的。阿里巴巴通过阿里云提供了与 OpenAI API 兼容的应用程序接口,方便开发者集成。用户还可以通过类似 ChatGPT 的聊天机器人界面 Qwen Chat 访问该模型。
阿里巴巴最近在去年 8 月还发布了新的视觉语言模型 Qwen2-VL。该模型具有先进的视频理解能力,可以处理长达 20 分钟的高质量视频并回答相关内容的问题。
好文章,需要你的鼓励
Intermedia 推出业内首个将统一通信和客户体验功能完全嵌入微软 Teams 的服务。这项创新不仅提升了 Teams 用户的生产力,还改善了客户体验。新功能支持多渠道通信、企业级通话功能和 AI 分析,为企业提供了一个强大的通信和客户体验平台。
Komprise 推出了 AI 驱动的数据管道,可自动检测和保护个人隐私信息 (PII)。这项新功能旨在帮助企业防止 PII 和其他敏感数据泄露,应对非结构化数据增长和生成式 AI 带来的风险。通过系统化方法减少敏感数据风险,提升网络安全和 AI 数据治理能力。
Oumi PBC公司宣布推出全球首个"无条件开放的AI平台",旨在通过提供开放访问基础模型、数据集和开发工具,创建协作式AI研发生态系统。该平台支持从1000万到4050亿参数的模型训练,适用于文本和多模态模型,并集成了多种流行的推理引擎。Oumi致力于打破当前AI研究领域的创新壁垒,加速AI领域的进展和发现。
阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。