腾讯开源混元MT翻译模型系列

腾讯今日开源混元MT系列语言模型，专门针对翻译任务进行优化。该系列包含四个模型，其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练，并采用强化学习进行优化。在WMT25基准测试中，混元MT在31个语言对中的30个表现优于谷歌翻译，某些情况下得分高出65%，同时也超越了GPT-4.1和Claude 4 Sonnet等模型。

腾讯控股有限公司今天开源了一个新的语言模型系列——混元MT系列，该系列专门针对翻译任务进行了优化。

这家中国科技公司表示，该算法在一个流行的人工智能翻译基准测试中显著超越了谷歌翻译的表现。

混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数。此外还有两个量化或压缩版本的算法，这些版本通过牺牲一些输出质量来降低内存使用量。

腾讯使用四个不同的数据集对模型进行初始训练。前两个数据集包含33种语言编写的文本片段，但不包含任何关于如何执行翻译的信息。另外两个数据集包含数百万个所谓的配对数据，这些记录各自包含一个文本片段和对应的翻译。

根据腾讯的介绍，训练流程不仅为其混元MT模型配备了翻译能力，还提供了大量的通用知识。该公司使用名为MMLU-Pro的通用知识基准测试对算法进行了测试。混元MT显著超越了拥有80亿参数的Llama-3-8B-Base模型。

腾讯在初始训练后进行了强化学习阶段。在项目的这一部分，公司为混元MT模型提供了一系列训练任务，并对其响应质量提供反馈。模型利用这些反馈来提高输出质量。

这种试错学习过程由一个定制的AI模型监督。该模型根据混元MT生成的翻译与原文的语义相似性来评分，同时还考虑其他因素，包括算法处理特定领域术语的能力。

混元MT系列中的第一个AI——混元MT-7B，基于标准的语言模型架构。混元MT-Chimera-7B使用了一种更复杂的处理方法，称为集成学习。

与专家混合模型类似，集成学习算法包含多个神经网络。但专家混合模型只使用其中一个神经网络来处理用户提示，而集成学习使用所有神经网络。它为提示生成多个答案，然后将它们组合成一个更高质量的单一响应。

腾讯使用名为WMT25的AI翻译基准将混元MT与谷歌翻译进行了比较。根据该公司的说法，其模型系列在测试评估的31个语言对中的30个表现更好。在某些情况下，混元MT的得分高出65%。

该模型系列还超越了其他几家AI提供商的算法。腾讯表示，混元MT在WMT25基准测试的大多数语言对中得分高于GPT-4.1和Anthropic公司的Claude 4 Sonnet。

Q&A

Q1：混元MT系列包含哪些模型？

A：混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数，此外还有两个量化或压缩版本的算法，这些版本通过牺牲一些输出质量来降低内存使用量。

Q2：混元MT在翻译基准测试中表现如何？

A：腾讯使用WMT25基准将混元MT与谷歌翻译进行比较，其模型系列在测试评估的31个语言对中的30个表现更好，在某些情况下得分高出65%。同时在大多数语言对中得分也高于GPT-4.1和Claude 4 Sonnet。

Q3：混元MT-Chimera-7B与混元MT-7B有什么区别？

A：混元MT-7B基于标准的语言模型架构，而混元MT-Chimera-7B使用了更复杂的集成学习处理方法。集成学习使用所有神经网络为提示生成多个答案，然后将它们组合成一个更高质量的单一响应。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

腾讯开源混元MT翻译模型系列

来源：SiliconANGLE

2025

09/11

11:42

分享

点赞

AWS推出主权AI本地部署方案及新一代AI加速器

HPE 2025年存储业务：Alletra产品线全面崛起

AWS与谷歌云合作推出多云快速连接服务

AV Linux 25和MX Moksha 25发布：两款音频制作专用Linux发行版

Windows智能体操作系统引争议：AI不应深入OS核心

Gartner发布2026-2029年企业存储战略路线图

MongoDB强调AI优势并质疑PostgreSQL扩展性

Mistral发布新一代开放权重模型挑战科技巨头

DeepSeek回应消失传闻，发布DeepSeek V3.2模型

NVIDIA 与新思科技宣布建立战略合作伙伴关系，携手重塑工程与设计未来

对话高途创始人陈向东：AI浪潮里，如何重写“教”和“育”？

Z世代与AI重塑商业世界：数字原住民如何驾驭人工智能浪潮

微软结束OpenAI独家合作，Office将引入Anthropic模型

OpenAI与Oracle签署3000亿美元云计算合作协议

Spotify因万名用户出售数据构建AI工具而愤怒

Anthropic服务大规模宕机，开发者调侃重回"原始编程时代"

AI说谎的原因：它只是在迎合你想听的答案

Adobe推出首个AI智能体套件，变革企业营销体验

网络出版商联合推出RSL标准，要求AI公司按输出付费

构建AI就绪数据文化的五项关键行动

Coursera推出AI面试官帮用户练习求职面试

英国政府研究显示：AI技术或在辅助功能领域实现最大突破

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: