Meta推出多模态推理模型Muse Spark，医疗问答能力领先同类产品

Meta正式推出新款推理模型Muse Spark，擅长回答健康类问题及分析多模态数据。该模型将于未来几周上线Meta AI服务，并通过API向开发者开放（目前为私测阶段）。据Meta介绍，Muse Spark在多项基准测试中超越Claude 4.6 Opus、Gemini 3.1 Pro及GPT 5.4，在医疗问答评测HealthBench Hard上领先第二名逾2%。此外，该模型计算效率大幅提升，所需算力较前代模型Llama 4 Maverick降低逾一个数量级。

Meta Platforms今日发布了一款全新推理模型Muse Spark，该模型在回答健康类问题及分析多模态数据方面表现尤为出色。

未来几周内，Meta将把这一算法逐步部署至面向消费者的Meta AI服务中。与此同时，Muse Spark也将通过应用程序编程接口（API）向开发者开放，目前该API处于私有预览阶段。

Meta表示，Muse Spark在多项基准测试中的表现超越了Claude 4.6 Opus、Gemini 3.1 Pro和GPT 5.4。其中一项测试为HealthBench Hard，专门用于衡量AI模型回答医学问题的能力。Muse Spark的得分比排名第二的GPT 5.4高出逾2个百分点。

该模型的出色表现，部分源于Meta在逾1000名医生的协助下整理编制的临床训练数据集。这一数据集是公司对AI开发流程进行全面升级的重要成果之一。据这家Facebook母公司介绍，其工程师还对模型架构及训练后工作流程进行了优化改进。

Meta在今日发布的博客文章中表示："与我们的上一代模型Llama 4 Maverick相比，我们仅需不到其十分之一的算力，便能达到相同的能力水平。这一进步也使Muse Spark相较于目前主要的可比基础模型，在效率上具备显著优势。"

科学图表分析是Muse Spark另一项领先竞品的能力。在CharXiv Reasoning这一由技术图表构成的基准数据集上，Muse Spark的表现超越了Opus 4.6及其他竞争模型。这种视觉推理能力同样适用于更广泛的应用场景——用户可以在Meta AI应用中上传一张超市货架的照片，并让模型估算每种食品的卡路里含量。

Meta还对Muse Spark进行了另外十余项基准测试。在许多测试中，其得分与Opus 4.6、Gemini 3.1 Pro和GPT 5.4相差无几，且在多项评估中均领先于至少一款竞争模型。这些基准测试涵盖代码生成、机器人导航和工具调用等多个应用场景。

Muse Spark还可通过开启"深思模式（Contemplating mode）"来提升输出质量。该功能会同时启动多个AI智能体，将任务分解为若干子步骤并行处理。Meta表示，这项技术使Muse Spark在HLE这一AI领域公认的最难基准测试之一上的得分提升了约8%。

Muse Spark是Meta规划中的系列多模态推理模型中的首款产品。Meta在今日的博客文章中写道："我们正处于可预期且高效的规模扩展轨道上，期待很快向外界分享在通往个人超级智能道路上能力日益增强的系列模型。"

Q&A

Q1：Muse Spark在医疗健康方面有什么突出表现？

A：Muse Spark在HealthBench Hard基准测试中表现优异，该测试专门衡量AI模型回答医学问题的能力。Muse Spark的得分比排名第二的GPT 5.4高出逾2个百分点。这一成绩部分得益于Meta联合逾1000名医生共同编制的临床训练数据集，使模型在医疗问答领域具备较强的专业能力。

Q2：Muse Spark的"深思模式"是什么，有什么作用？

A：深思模式（Contemplating mode）是Muse Spark的一项可选功能，开启后会同时启动多个AI智能体，将复杂任务拆解为若干子步骤并行处理，从而提升输出质量。根据Meta的测试数据，该模式使Muse Spark在AI领域公认的高难度基准测试HLE上的得分提升了约8%，有效增强了模型面对复杂任务时的推理表现。

Q3：Muse Spark和上一代模型Llama 4 Maverick相比效率提升了多少？

A：根据Meta的官方说法，Muse Spark仅需Llama 4 Maverick不到十分之一的算力，便能达到相同的能力水平。这意味着在计算资源消耗方面实现了数量级的大幅降低，使Muse Spark相较于目前市场上主要的可比基础模型在运行效率上具备显著优势。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Meta推出多模态推理模型Muse Spark，医疗问答能力领先同类产品

来源：SiliconANGLE

2026

04/09

15:13

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Meta超级智能实验室发布首个公开模型Muse Spark

AWS首席执行官解释为何同时投资Anthropic与OpenAI并不存在利益冲突

Databricks推出AiChemy多智能体AI系统，助力药物研发加速

Meta携全新模型Muse Spark重返AI竞争赛道

Meta推出由高薪超级智能实验室研发的全新AI模型

Visual Studio Code 1.114 更新：AI 聊天体验全面优化

Anthropic限制Claude订阅用户使用OpenClaw，并提供积分补偿

英特尔加入马斯克Terafab项目，芯片超级工厂梦想能否成真？

两款AI学术智能体：自动生成论文图表与同行评审

Tubi成为首个在ChatGPT内推出原生应用的流媒体平台

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会