一种机器学习工具通过分析电子健康记录数据、检查结果和患者人口统计信息,能够帮助临床医生识别肝细胞癌(HCC)高危人群。肝细胞癌是最常见的肝癌形式。
这是发表在《癌症发现》期刊上一项研究的结论,该研究利用了英国生物样本库50万人的数据,其中包括538例肝细胞癌病例,超过三分之二(69%)的病例发生在没有肝硬化、病毒性肝炎或其他慢性肝病等危险因素的患者中。
研究人员使用英国生物样本库80%的数据训练模型,并在剩余20%的数据上进行初步验证,同时还在美国40万人的All of Us注册数据库上进行了额外验证,该数据库包含445例肝细胞癌病例。
德国亚琛工业大学的共同首席研究员卡罗琳·施耐德表示,该研究的总体目标是寻找改善当前肝细胞癌风险识别方法的途径。目前的方法主要关注狭窄的高风险人群,使用影像学和基于血液的癌症筛查,可能会遗漏许多高危个体。
她说:"筛查通常推荐给已确诊肝硬化或严重肝病的患者,因为许多肝细胞癌病例发生在这些患者中,但还有许多未诊断肝硬化或具有其他危险因素的个体也可能受益。"
他们PRE-Screen-HCC算法的一个版本(模型C)分析了广泛的数据范围,包括人口统计、生活方式、健康记录和血液检查,研究作者表示该模型能够在人群规模上"高精度"地分层个体肝细胞癌发病风险。
有趣的是,添加基因组学和/或代谢组学数据(这在人群水平上可能具有挑战性)并没有显著提高其性能。
施耐德说:"这表明我们可以使用简单、易获得的数据预测肝细胞癌风险,而无需复杂且昂贵的基因测序。"她补充说,这一特点提高了模型广泛应用的潜力,特别是在资源有限的环境中。
肝细胞癌是第五大常见恶性肿瘤,也是全球癌症相关死亡的第三大原因,发病率不断上升,主要由肝病发病率上升驱动,这使其成为一个重大的公共健康问题。
研究人员表示,尽管PRE-Screen-HCC主要基于英国生物样本库的白人参与者数据进行训练,但在种族更加多样化的All of Us队列的非白人亚组中评估时,仍保持了其性能,这为其在不同人群中的应用潜力带来了良好前景。
来自德国德累斯顿工业大学的第一作者扬·克卢斯曼说:"由于有如此多的因素影响风险,迫切需要有效的工具来帮助临床医生识别高危患者。能够同时处理不同类型临床数据的机器学习工具对于这一重大临床挑战可能特别有用。"
Q&A
Q1:PRE-Screen-HCC算法是什么?
A:PRE-Screen-HCC是一种机器学习算法,通过分析人口统计、生活方式、健康记录和血液检查等数据,能够高精度地预测个体患肝细胞癌的风险,帮助临床医生识别高危人群。
Q2:这个算法相比传统筛查方法有什么优势?
A:传统筛查主要针对已确诊肝硬化或严重肝病的患者,容易遗漏其他高危人群。PRE-Screen-HCC算法使用简单易获得的数据,无需复杂基因测序,能够在更大人群范围内识别风险,特别适用于资源有限的环境。
Q3:PRE-Screen-HCC算法在不同种族人群中效果如何?
A:研究显示,尽管算法主要基于英国生物样本库的白人数据训练,但在美国All of Us数据库更具种族多样性的非白人亚组中评估时,仍保持良好性能,表明其在不同人群中具有应用潜力。
好文章,需要你的鼓励
Kollmorgen发布NDC布局助手软件工具,专为工厂和仓库中的自动导引车(AGV)及自主移动机器人(AMR)的路线规划与优化而设计。该工具通过分段分析路线,帮助工程师在系统部署前识别瓶颈与低效环节,提供行驶时间、车速及优化潜力等关键数据,并以可视化方式标注问题区域,从而缩短布局设计与验证周期。Kollmorgen表示,该工具未来还将融入AI驱动的优化能力。
这篇由加州大学圣地亚哥分校等六所机构联合发布的综述(arXiv:2605.02913,2026年4月),首次系统梳理了大型语言模型强化学习训练中长期被忽视的轨迹设计问题,提出了GFCR四模块框架(生成、过滤、控制、回放),覆盖数学、代码、多模态和智能代理等多个应用场景,并附有实用的故障诊断手册,为AI训练工程师提供系统性的方法论指导。
现代仓储已从幕后走向前台,配送速度成为品牌竞争核心。面对次日达甚至两小时送达的市场压力,领先履约中心借鉴敏捷开发理念,以周为单位迭代代码、机器人与工作流程。IoT信标、边缘计算与视觉识别模块构建双层架构,实现厘米级货盘追踪与低延迟决策。人机协作模式让员工从重体力劳动转向异常处理与数据分析,拣选准确率突破99%。同时,自动化系统实时采集碳排放数据,在提速的同时实现可量化的减排目标。
中国科学技术大学与FrameX.AI联合提出Stream-R1框架,针对AI视频生成蒸馏训练中"一视同仁"的核心缺陷,引入奖励模型对训练样本进行双重加权:在样本层面根据质量分数筛选可靠的学习信号,在像素与帧层面通过梯度显著性热力图集中优化最需改进的区域,使4步快速学生模型在VBench多项指标上超越慢速多步教师模型,推理速度提升30倍且不增加任何额外计算开销。