近日,夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。

QuarkMed Technical Report
此前,夸克健康大模型成功通过了中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。
面对医疗模型需要高质量、高专业度训练数据的问题,夸克健康大模型在模型训练不同阶段,使用了三类核心医疗数据:医学资料、医学知识和医疗记录,数据总量高达约1万亿Token。这些专业数据能有效弥补预训练语料库的不足,有助于提高模型的准确性与推理能力。

医疗数据源分类及规模
为提升模型正确性、安全性以及复杂推理能力,夸克健康大模型引入两个强化学习(RL)阶段。第一阶段通过大规模医学强化学习,提升大模型在复杂场景中的推理能力。第二阶段通过设计奖励模型,从诚实性、有用性、内容合规性三个角度评估模型输出质量、调整模型行为,使其符合人类偏好和价值观。

训练期间,针对一般任务和推理任务使用三种类型的奖励信号
技术报告同时还公布了多个性能测试结果。在MedQA等多个国际权威数据集测试中,夸克健康大模型相比o3-mini等同尺寸模型表现出了更优异的性能。在中国医师资格考试(CPQExam)笔试评测中,笔试难度越高,夸克健康大模型领先优势越明显。

CPQExam测试结果
报告中透露,夸克计划将医师考试测试集全面公开,以促进医学相关的AI研究。
好文章,需要你的鼓励
OpenAI宣布将Codex桌面AI编程工具与ChatGPT移动应用整合,用户可通过iOS或Android手机远程控制电脑上的Codex执行任务。该功能支持查看任务线程、审批命令、切换模型等操作,文件与权限仍保留在本地电脑,实时更新推送至手机。此举被视为OpenAI应对Anthropic Claude Code竞争、打造桌面"超级应用"战略的重要一步。该功能目前已向所有ChatGPT套餐用户开放预览,包括免费版。
这项来自MemTensor与HONOR的联合研究提出MemPrivacy框架,通过在边缘设备上用带类型标签的占位符替换隐私信息、云端处理后本地还原,在保护用户隐私的同时将AI记忆服务质量损失控制在1.6%以内。
据韩国媒体报道,三星将于7月22日在伦敦举办年度第二场Unpacked发布会,届时将推出首款智能眼镜Galaxy Glasses,同期亮相的还有Galaxy Z Fold 8、Z Flip 8及Galaxy Watch 9。该眼镜搭载三星与谷歌联合开发的Android XR系统,集成Gemini AI,支持拍照、导航、实时翻译及智能家居控制。设计由潮流眼镜品牌Gentle Monster操刀。全球智能眼镜市场预计将从2025年的25亿美元增长至2033年的144亿美元。
韩国大学团队提出THINC框架,让AI在解数学题时用代码替代文字推理,4B小模型超越百倍体量大模型,代码接地率达99.2%。