Meta发布四款自研AI推理芯片，最高性能达10 petaflops

Meta公司今日发布四款自主设计的AI推理芯片，用于内部人工智能工作负载。其中MTIA 300已投入生产，专门处理排序和推荐模型。最先进的MTIA 500预计2027年投产，支持生成式AI推理，性能达10 petaflops，配备516GB内存。这些芯片采用模块化设计，可在相同物理架构中部署，加速从硅片到生产的转换过程。

Meta Platforms公司今日宣布已设计出四款定制芯片，用于支持其内部人工智能工作负载。

该公司上次更新处理器开发进展是在2024年。当年4月，Meta发布了一款功耗为90瓦的定制AI加速器。而今天发布的四款加速器中最先进的一款热设计功耗达到1700瓦。

Meta在2024年4月发布的定制芯片MTIA 200专门用于运行排序和推荐模型。这些神经网络帮助Meta决定在用户信息流中显示哪些帖子和广告。

今天发布的第一款新芯片MTIA 300专注于相同的应用场景。该芯片在处理MX8格式数据时可提供1.2 petaflops的性能，配备216GB的HBM内存。

Meta工程师团队在今日的博客文章中写道："MTIA 300包含一个计算芯片、两个网络芯片和多个HBM堆栈。每个计算芯片包含一个处理单元网格，并配有一些冗余处理单元以提高良品率。"

MTIA 300是四款新发布芯片中唯一已在生产环境中部署的产品。其他三款处理器支持更广泛的应用场景。除了排序和推荐工作负载外，它们还能运行生成式AI软件，如大语言模型。

产品线中最先进的MTIA 500芯片在处理MX8数据时可提供10 petaflops的性能。它还支持更高效的MX4数据格式。这项技术减少了AI模型回答提示时需要分析的字节数，从而加快处理速度。

MTIA 500使用四个逻辑芯片进行计算。这些模块被多个HBM内存堆栈环绕，总共可存储高达516GB的数据，是MTIA 300的两倍。该处理器的组件清单还包括一个SoC芯片，负责在主机服务器之间传输信息。

MTIA 500预计将于2027年投产，同时推出的还有功能相似但性能稍低的MTIA 450芯片。这两款处理器都针对生成式AI推理工作负载进行了优化。它们包含专门设计的电路，用于加速推理工作流程中特定的硬件密集型元素，如FlashAttention。这是一种流行的注意力机制实现方式，大语言模型用它来分析输入数据。

Meta工程师写道："在系统层面，MTIA 400、450和500都使用相同的机箱、机架和网络基础设施。因此，每一代新芯片都可以直接替换到相同的物理空间中，加速从硅片到生产部署的过渡。我们的模块化、可重用设计还最大限度地减少了开发和部署多代芯片所需的资源。"

Meta使用定制编译器为其MTIA芯片优化AI模型。另一个定制软件模块Hoot集体通信库管理处理器之间的数据流。它使用位于内存单元附近的晶体管执行某些计算，减少数据传输时间，从而提升性能。

这些芯片的发布距离Meta同意从英伟达公司和超微半导体公司购买价值数十亿美元的处理器不到一个月。大约同一时间，消息人士告诉The Information，这家Facebook母公司还计划采用谷歌的TPU加速器。据报道，该公司将使用这些芯片来运行大语言模型。

Q&A

Q1：MTIA 500芯片有什么特殊性能？

A：MTIA 500是Meta最先进的AI芯片，在处理MX8数据时可提供10 petaflops的性能，还支持更高效的MX4数据格式。该芯片使用四个逻辑芯片进行计算，配备516GB的HBM内存，预计2027年投产。

Q2：Meta为什么要自研AI芯片？

A：Meta自研芯片主要用于支持内部人工智能工作负载，包括排序推荐模型和生成式AI软件如大语言模型。通过定制芯片，Meta可以更好地优化AI模型性能，减少对外部供应商的依赖。

Q3：MTIA芯片系列有哪些不同型号？

A：Meta发布了四款MTIA芯片：MTIA 200专门用于排序推荐，MTIA 300已投产并提供1.2 petaflops性能，MTIA 450和500都支持生成式AI推理，其中MTIA 500性能最强达10 petaflops。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Meta发布四款自研AI推理芯片，最高性能达10 petaflops

来源：SiliconANGLE

2026

03/12

17:36

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

OpenAI的Sora视频生成器即将集成到ChatGPT中

AI聊天机器人正在让人们思维趋同，研究称

Zendesk收购智能体客户服务初创公司Forethought

福特推出新AI助手 可监控商用车队安全带使用情况

AI与数理科学：探索跨领域合作的未来路径

Meta发布四款Broadcom定制AI芯片，性能超越商用产品

研究显示：大部分聊天机器人会协助策划校园枪击等暴力行为

AI聊天机器人鼓励暴力行为，多项测试揭示安全隐患

Canva推出Magic Layers功能，可将AI生成图像自动分层编辑

Grammarly停用争议性AI功能，曾冒用真实作家身份提供写作建议

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

福特推出新AI助手可监控商用车队安全带使用情况