夸克公开国内首个覆盖全阶段医师考试的健康大模型测试集

夸克将其训练健康大模型的医师考试测试集悉数公开，这是国内首个覆盖全阶段医师考试的大模型测试集。

9月16日消息，夸克将其训练健康大模型的医师考试测试集悉数公开，这是国内首个覆盖全阶段医师考试的大模型测试集。

据了解，前不久夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测，并发布技术报告《QuarkMed Technical Report》，公开了“主任医师级”能力技术实现细节。通过公开模型研发技术与医师考试测试集，夸克旨在推动AI与医疗相融合的进一步发展。

此前国内一直缺少一款时效性高、覆盖面全的医师考试测试集。夸克本次公开的医师考试测试集覆盖执业医师、主治医师、副主任医师、主任医师全阶段考试，精选普通内科学、普通外科学、妇产科学、儿科学等12门核心学科，共计约7600道题，真题部分均取自2024年最新考试。

该测试集将不同测试等级有效梯度化。初级考试以单选题、记忆类题目为主，随着考试级别升高，多选题、案例分析题比例随之升高，对模型的推理能力也要求越高。梯度化的测试集能为模型测试提供更明确的标准，并能有效发现模型短板、推动模型优化升级。

壹生检康 CEO 王强宇表示，该测试集让创业团队少走很多弯路，豆蔻妇科大模型训练过程中遇到的关键难题是如何评判模型性能，“MedBench这些通用医疗基准在妇科场景下适配性很差，无法准确衡量模型真实水平。有了夸克这套专业测试集，我们不用在基础素材上耗费精力，能把更多资源投入到模型算法优化、妇科场景深度适配这些核心工作上。”

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

夸克公开国内首个覆盖全阶段医师考试的健康大模型测试集

来源：至顶网人工智能频道

2025

09/16

15:48

分享

点赞

AI系统在压力下学会战略性欺骗的深层原因

数据中心备份电力系统对比分析

Paxos以超1亿美元收购加密钱包初创公司Fordefi

腾讯发布"读图神器"HunyuanOCR，只用1%的参数就打败了行业巨头？

联想天津工厂入选“世界智能制造十大科技进展” 以零碳智造打造业内标杆

联想万全异构智算研发团队入选IEEE CyberSciTech 2025，RNL技术成果获国际认可！

首款搭载千问的AI硬件：夸克AI眼镜新品发布 次日门店现排队潮

ServiceNow或以超10亿美元收购网络安全初创公司Veza

谷歌云推出"PanyaThAI"计划加速泰国AI应用

英国产学合作推进光纤射频通信技术商业化进程

阿里巴巴推出可换电池设计的Quark AI智能眼镜

CIO影响力提升的关键：构建内部联盟

夸克公开健康大模型技术报告，解密如何打造AI“主任医师”

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

4000万考生和家长用AI报志愿，夸克刷新高考服务纪录

生成超1000万份志愿报告，夸克实现国内最大规模深度研究应用

网友反馈夸克志愿报告排队太久，阿里吴嘉：已紧急扩充算力

夸克发布首个可生成完整志愿报告的Agent

夸克健康大模型通过副主任医师考试，12门学科超合格线

夸克发布全新产品“深度搜索”，解决用户复杂问题降低决策成本

夸克AI超级框上新“拍照问夸克” 加码多模态能力

从“解题答疑”到“培养思维”，夸克“AI解题大师”定义AI产品新价值

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

首款搭载千问的AI硬件：夸克AI眼镜新品发布次日门店现排队潮