夸克健康大模型通过副主任医师考试，12门学科超合格线

大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

5月27日，夸克健康大模型在12门国家副主任医师职称考试中成绩超过合格线，成为国内首个成功跨越这一门槛的大模型。这意味大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。

此前，国内大模型多停留在临床执业医师资格考试阶段，只能拿到初级职称。夸克则实现了从初级到副高级职称的两级跳。夸克健康大模型以通义千问为基础，通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。

全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现，对于严肃医疗问题夸克会通过先分析后搜索，动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。

此次副主任医师职称考试评测覆盖了12个常用学科，包括：全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。在上述学科领域，夸克健康大模型均超过合格线，并在全科医学、肿瘤内科学、皮肤与性病学、精神病学4个学科达到主任医师及格线。

夸克健康大模型通过副主任医师考试，12门学科超合格线

在初级与中级职称考试中，更小尺寸的夸克健康大模型相比满血版基础模型最高领先7分和10分左右。进入难度显著提高、强调临床综合运用的副高职称考试时，夸克最高领先幅度扩大至30分，在长链推理、诊疗路径规划上有显著提升。这项研究验证了垂直模型在性能提升上具备巨大潜力。

对题型维度的深入剖析显示，多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足60%，而夸克借助“医疗长思考”机制达到71%。在病例分析题中，夸克通过检索增强与分步推理组合策略，将正确率提升至53%。

夸克健康算法工程师徐健表示，“机器通过考试并不意味着可以替代医生，但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力，帮助医生和患者提升诊疗效率，为用户在居家场景下提供更多健康管理能力”。

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

夸克健康大模型通过副主任医师考试，12门学科超合格线

来源：至顶网人工智能频道

2025

05/27

11:12

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

解锁对象存储+TP数据库，OceanBase快人一步

大模型应用开发，CPU如何发光发热？

夸克发布全新产品“深度搜索”，解决用户复杂问题降低决策成本

夸克AI超级框上新“拍照问夸克” 加码多模态能力

魔法原子人形机器人走出“练兵场”

魔法原子举办2025场景战略发布会 官宣“千景共创计划”落地1000个应用场景

从“解题答疑”到“培养思维”，夸克“AI解题大师”定义AI产品新价值

傅利叶正式开源全尺寸人形机器人数据集Fourier ActionNet，并发布全球首个全流程工具链

《AI启示录》：当ERP长出AI神经，胜负手在于业务扎根

新夸克告别搜索 升级为一个无边界的“AI超级框”

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

魔法原子举办2025场景战略发布会官宣“千景共创计划”落地1000个应用场景

新夸克告别搜索升级为一个无边界的“AI超级框”