近日,夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。

QuarkMed Technical Report
此前,夸克健康大模型成功通过了中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。
面对医疗模型需要高质量、高专业度训练数据的问题,夸克健康大模型在模型训练不同阶段,使用了三类核心医疗数据:医学资料、医学知识和医疗记录,数据总量高达约1万亿Token。这些专业数据能有效弥补预训练语料库的不足,有助于提高模型的准确性与推理能力。

医疗数据源分类及规模
为提升模型正确性、安全性以及复杂推理能力,夸克健康大模型引入两个强化学习(RL)阶段。第一阶段通过大规模医学强化学习,提升大模型在复杂场景中的推理能力。第二阶段通过设计奖励模型,从诚实性、有用性、内容合规性三个角度评估模型输出质量、调整模型行为,使其符合人类偏好和价值观。

训练期间,针对一般任务和推理任务使用三种类型的奖励信号
技术报告同时还公布了多个性能测试结果。在MedQA等多个国际权威数据集测试中,夸克健康大模型相比o3-mini等同尺寸模型表现出了更优异的性能。在中国医师资格考试(CPQExam)笔试评测中,笔试难度越高,夸克健康大模型领先优势越明显。

CPQExam测试结果
报告中透露,夸克计划将医师考试测试集全面公开,以促进医学相关的AI研究。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。