腾讯开源混元MT翻译模型系列

腾讯今日开源混元MT系列语言模型，专门针对翻译任务进行优化。该系列包含四个模型，其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练，并采用强化学习进行优化。在WMT25基准测试中，混元MT在31个语言对中的30个表现优于谷歌翻译，某些情况下得分高出65%，同时也超越了GPT-4.1和Claude 4 Sonnet等模型。

腾讯控股有限公司今天开源了一个新的语言模型系列——混元MT系列，该系列专门针对翻译任务进行了优化。

这家中国科技公司表示，该算法在一个流行的人工智能翻译基准测试中显著超越了谷歌翻译的表现。

混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数。此外还有两个量化或压缩版本的算法，这些版本通过牺牲一些输出质量来降低内存使用量。

腾讯使用四个不同的数据集对模型进行初始训练。前两个数据集包含33种语言编写的文本片段，但不包含任何关于如何执行翻译的信息。另外两个数据集包含数百万个所谓的配对数据，这些记录各自包含一个文本片段和对应的翻译。

根据腾讯的介绍，训练流程不仅为其混元MT模型配备了翻译能力，还提供了大量的通用知识。该公司使用名为MMLU-Pro的通用知识基准测试对算法进行了测试。混元MT显著超越了拥有80亿参数的Llama-3-8B-Base模型。

腾讯在初始训练后进行了强化学习阶段。在项目的这一部分，公司为混元MT模型提供了一系列训练任务，并对其响应质量提供反馈。模型利用这些反馈来提高输出质量。

这种试错学习过程由一个定制的AI模型监督。该模型根据混元MT生成的翻译与原文的语义相似性来评分，同时还考虑其他因素，包括算法处理特定领域术语的能力。

混元MT系列中的第一个AI——混元MT-7B，基于标准的语言模型架构。混元MT-Chimera-7B使用了一种更复杂的处理方法，称为集成学习。

与专家混合模型类似，集成学习算法包含多个神经网络。但专家混合模型只使用其中一个神经网络来处理用户提示，而集成学习使用所有神经网络。它为提示生成多个答案，然后将它们组合成一个更高质量的单一响应。

腾讯使用名为WMT25的AI翻译基准将混元MT与谷歌翻译进行了比较。根据该公司的说法，其模型系列在测试评估的31个语言对中的30个表现更好。在某些情况下，混元MT的得分高出65%。

该模型系列还超越了其他几家AI提供商的算法。腾讯表示，混元MT在WMT25基准测试的大多数语言对中得分高于GPT-4.1和Anthropic公司的Claude 4 Sonnet。

Q&A

Q1：混元MT系列包含哪些模型？

A：混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数，此外还有两个量化或压缩版本的算法，这些版本通过牺牲一些输出质量来降低内存使用量。

Q2：混元MT在翻译基准测试中表现如何？

A：腾讯使用WMT25基准将混元MT与谷歌翻译进行比较，其模型系列在测试评估的31个语言对中的30个表现更好，在某些情况下得分高出65%。同时在大多数语言对中得分也高于GPT-4.1和Claude 4 Sonnet。

Q3：混元MT-Chimera-7B与混元MT-7B有什么区别？

A：混元MT-7B基于标准的语言模型架构，而混元MT-Chimera-7B使用了更复杂的集成学习处理方法。集成学习使用所有神经网络为提示生成多个答案，然后将它们组合成一个更高质量的单一响应。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

腾讯开源混元MT翻译模型系列

来源：SiliconANGLE

2025

09/11

11:42

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

微软结束OpenAI独家合作，Office将引入Anthropic模型

OpenAI与Oracle签署3000亿美元云计算合作协议

Spotify因万名用户出售数据构建AI工具而愤怒

Anthropic服务大规模宕机，开发者调侃重回"原始编程时代"

AI说谎的原因：它只是在迎合你想听的答案

Adobe推出首个AI智能体套件，变革企业营销体验

网络出版商联合推出RSL标准，要求AI公司按输出付费

构建AI就绪数据文化的五项关键行动

Coursera推出AI面试官帮用户练习求职面试

英国政府研究显示：AI技术或在辅助功能领域实现最大突破

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: