英国生物银行已完成世界上最大规模的全身成像项目,从10万名志愿者中收集了超过10亿次扫描数据,这些数据将成为观察人体衰老和疾病过程的重要工具。
该医学成像项目的数据自十年前启动以来已分批发布,并已被用于开发针对心脏病、痴呆症和癌症等改变生活的疾病的更好诊断测试。
目前,8万人的成像结果——与去标识化的生活方式、病史、遗传学和血液蛋白数据相关联——可供全球获得批准的研究人员使用,其余部分预计将在年底前添加到资源库中。
完成这10万次扫描耗时11年,每次扫描需要5小时,由英国医学研究委员会(MRC)、惠康基金会、英国心脏基金会(BHF)和英国痴呆症平台(DPUK)共同投资6200万英镑(8300万美元)。
该成像项目的第二阶段于2022年启动,旨在对这10万名扫描参与者中的6万人进行重复成像,时间至少在他们首次成像预约两年后。该阶段预计于2029年完成,与此同时,该项目将继续邀请英国生物银行的志愿者参加超出10万人目标的成像预约。
"这个成像项目的规模前所未有——比之前任何项目都大10倍以上——使科学家能够看到原本无法观察到的疾病模式,"英国生物银行首席研究员兼首席执行官罗里·柯林斯教授说。
"从10万名志愿者那里收集扫描数据似乎是一个不切实际的梦想[...]一些专家甚至问我们是否错误地多加了一个零!"他补充道。"这个大规模成像项目正在让不可见的变为可见。更重要的是,通过将这些来自身体不同部位的图像与志愿者的所有遗传和生活方式信息相结合,科学家们正在更好地理解我们的身体是如何工作的。"
该项目迄今为止的成就包括开发了一个能够预测38种常见疾病早期发病的人工智能工具,以及一个创建个性化健康心脏版本的AI模型,该模型可用于识别患者实际心脏的差异并发现心脏病的早期征象。
其他项目揭示了如何使用MRI扫描诊断脂肪肝疾病,从而避免侵入性手术程序,以及发现十分之一的中年人在没有其他症状的情况下存在可能危及生命的主动脉钙化。
"最近的一项研究使用了2万名参与者的脑成像数据,结合活动监测和遗传数据,开发了一个AI工具来预测谁可能会患上阿尔茨海默病和帕金森病,"英国生物银行成像工作组主席保罗·马修斯教授评论道。
"我迫不及待地想看看10万人的成像数据会揭示什么!"
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。