正如达尔文雀类为了生存而对自然选择产生进化反应一样,构成恶性肿瘤的细胞同样会对抗选择压力以求生存、进化和扩散。实际上,肿瘤是具有独特结构和变化能力的复杂细胞集合体。
如今,人工智能和机器学习工具为我们提供了前所未有的机会,能够在遗传学、表观遗传学、代谢和微环境层面揭示控制肿瘤进展的普遍规律。
麻省理工学院生物系、科赫综合癌症研究所以及医学工程与科学研究所的助理教授Matthew G. Jones希望使用计算方法构建预测模型——与癌症进行一场棋局博弈,理解肿瘤进化和抗药性的能力,最终目标是改善患者预后。在这次访谈中,他介绍了自己目前的工作。
问:您正在探索和描述肿瘤进展的哪个方面?
答:癌症的一个非常常见现象是患者最初会对治疗产生反应,但最终治疗会失效。这主要是因为肿瘤具有令人难以置信且极具挑战性的进化能力:改变基因组成、蛋白质信号传导组成和细胞动力学的能力。肿瘤作为一个系统也会在结构层面进化。通常,患者死于肿瘤的原因是肿瘤要么进化到我们无法再控制的状态,要么以不可预测的方式进化。
从很多方面来说,癌症可以被认为一方面极度失调和无序,另一方面又具有自己的内在逻辑,而这种逻辑在不断变化。我实验室的核心理论是肿瘤在空间和时间上遵循典型模式,我们希望利用计算和实验技术来解码这些转化过程中的分子机制。
我们专注于肿瘤通过一种叫做染色体外DNA的DNA扩增形式进化的特定方式。这些从染色体上切除的ecDNA会形成环状结构,作为核内独立的DNA颗粒池存在。
ecDNA最初在20世纪60年代被发现,当时被认为是癌症中的罕见事件。然而,当研究人员在2010年代开始对大型患者队列应用下一代测序技术时,发现这些ecDNA扩增不仅能够赋予肿瘤更快适应压力和治疗的能力,而且比最初认为的要普遍得多。
我们现在知道这些ecDNA扩增在约25%的癌症中出现,特别是在最具侵袭性的癌症中:脑癌、肺癌和卵巢癌。我们发现,由于各种原因,ecDNA扩增能够改变肿瘤进化的规则手册,使其能够以非常令人意外的方式加速发展成更具侵袭性的疾病。
问:您如何使用机器学习和人工智能来研究ecDNA扩增和肿瘤进化?
答:我有责任将实验室工作转化为改善患者生活的成果。我想从患者数据开始,发现各种进化压力如何驱动疾病和我们观察到的突变。
我们用来研究肿瘤进化的工具之一是单细胞谱系追踪技术。广义上说,它们允许我们研究单个细胞的谱系。当我们对特定细胞进行采样时,我们不仅知道该细胞的外观,还能(理想情况下)精确定位侵袭性突变在肿瘤历史中出现的确切时间。这种进化历史为我们提供了研究这些动态过程的方法,否则我们无法实时观察这些过程,并帮助我们理解如何拦截这种进化。
我希望我们能够更好地对会对某些药物产生反应的患者进行分层,预测和克服药物耐药性,以及识别新的治疗靶点。
问:是什么吸引您加入麻省理工学院社区?
答:吸引我的一点是工程学和生物科学的卓越整合。在科赫研究所,每一层楼的结构都旨在促进工程师和基础科学家之间的交流,在校园之外,我们可以与大波士顿地区的所有生物医学研究企业建立联系。
吸引我来到麻省理工学院的另一个原因是它非常重视教育、培训和投资学生成功。我个人认为,学术研究与工业研究的区别在于学术研究本质上是一份服务工作,因为我们在培训下一代科学家。
将计算和实验技术学科的卓越性结合起来一直是我的使命。我希望招募的培训学员是那些渴望合作并解决需要两个学科的重大问题的人。科赫研究所为这种混合型实验室提供了独特的设置:我的干实验室就在湿实验室旁边,这是合作和联系的源泉,反映了科赫研究所的总体愿景。
Q&A
Q1:什么是染色体外DNA?它在癌症中起什么作用?
A:染色体外DNA(ecDNA)是从染色体上切除并形成环状结构的DNA片段,作为核内独立的DNA颗粒池存在。这些ecDNA扩增在约25%的癌症中出现,特别是在最具侵袭性的脑癌、肺癌和卵巢癌中。它们能够改变肿瘤进化的规则,使肿瘤能够更快地适应治疗压力,加速发展成更具侵袭性的疾病。
Q2:单细胞谱系追踪技术如何帮助研究肿瘤进化?
A:单细胞谱系追踪技术允许研究人员研究单个细胞的谱系历史。通过这项技术,科学家不仅能了解细胞的当前状态,还能精确定位侵袭性突变在肿瘤历史中出现的确切时间。这种进化历史帮助研究人员理解肿瘤的动态进化过程,为拦截肿瘤进化、预测药物反应和克服耐药性提供重要信息。
Q3:为什么癌症治疗会逐渐失效?
A:癌症治疗失效的主要原因是肿瘤具有强大的进化能力。肿瘤能够改变其基因组成、蛋白质信号传导组成和细胞动力学,同时在结构层面进化。患者最初会对治疗产生反应,但肿瘤会逐渐进化到无法控制的状态,或以不可预测的方式进化,最终导致治疗失效。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。