生成式AI合成神经元加速大脑图谱绘制

谷歌研究团队开发了神经元形态生成模型MoGen,通过生成合成神经元的3D形状来扩充训练数据,将大脑重建模型PATHFINDER的错误率降低4.4%。在完整小鼠大脑的规模下,这一改进相当于节省157个人年的人工校对工作量。MoGen已作为开源模型发布,支持小鼠、斑马雀和果蝇等多物种神经元的模拟生成,为未来更大规模的连接组学项目奠定基础。

利用计算机生成完整大脑的神经连接图谱,正在开启神经科学研究的新时代。此前发布的完整雄性果蝇大脑及中枢神经系统图谱,为研究大脑如何响应外部刺激、控制身体行为提供了重要的基础资源。

然而,重建哺乳动物乃至人类的完整大脑,目前仍遥不可及。果蝇大脑图谱包含约16.6万个神经元,凝聚了人工智能计算机与人类专家数年的共同努力。而一个完整小鼠大脑的规模是果蝇的一千倍,人类大脑又是小鼠的一千倍。

Google Research正在开发AI技术,通过加速神经元的识别、分类与可视化,推动更大规模的大脑图谱项目。与合作伙伴一起,研究团队已绘制出斑胸草雀大脑片段、完整斑马鱼幼鱼大脑和人类大脑的小片段图谱,并近期启动了小鼠大脑局部区域的图谱绘制工作。团队最新发表的论文《MoGen:基于点云流匹配的精细神经元形态生成》将在ICLR 2026上发表,该研究利用合成神经元形状来提升AI重建模型的性能。

通过神经元形态生成模型MoGen(Neuronal Morphology Generation)引入合成样本作为训练数据补充,重建误差降低了4.4%,并为进一步改进指明了方向。4.4%的误差改善幅度看似不大,但放大到完整小鼠大脑的规模,相当于节省了157人年的人工校对工作量。

这是Google Research连接组学团队历经十余年跨学科大脑科学研究所积累的一系列基础性工具的最新成果。

MoGen生成的合成神经元动画展示了初始点云如何逐步逼近真实神经元形状的过程。在这一案例中,MoGen经过训练可模拟小鼠神经元。利用MoGen生成的合成神经元来训练AI模型,能够有效降低大脑重建中的错误率。

连接组学与神经元重建

连接组学领域通过重建脑细胞(即神经元)来创建大脑神经连接图谱。该过程首先对薄层脑组织切片进行成像,再对图像进行堆叠、对齐与分割,将二维图像转化为三维神经元模型。最早完成的线虫完整大脑图谱依赖费时费力的人工方法,历时16年才告完成,而如今的研究借助数字成像和计算机技术大幅提升了效率。

Google Research团队使用AI模型,将显微镜图像转化为精准的三维神经元形状。AI模型的输出结果由人类专家进行校对和标注。这一最终验证步骤耗时最长,也是制约更宏大大脑图谱项目推进的关键瓶颈。

神经元形状的多样性与挑战

人体内大多数细胞呈球形,而生物神经元却呈现出形态各异、结构纤细复杂的多样形貌。神经元通过一条主要延伸结构——轴突——向外传递信号。轴突通常细长,可发生弯曲、扭转或分叉。神经元则通过被称为树突的分支延伸网络接收信号,树突上往往还长有被称为树突棘的较短突起。每个神经元还会形成大量突触,这是神经元之间传递电信号或化学信号的专门连接结构。

这种复杂的几何形态与神经元的生物功能密切相关,也是连接组学面临的核心挑战之一。团队最新的AI重建模型PATHFINDER首先识别神经突片段(即神经元的局部子结构),再将这些片段组合成完整神经元。显微成像数据中的不规则性可能导致"分裂错误"(即本应相连的两段神经突被错误分离)或"合并错误"(即两段无关神经突被错误合并)。这类错误十分严重,需要由校对人员——通常是研究人员、研究生或技术专家——手动修正。

MoGen:合成训练数据的生成

研究团队假设,增加训练数据(即便是合成数据)能够提升PATHFINDER的性能。合成训练数据已在自然语言处理、图像生成和自动驾驶等领域取得了成功应用。

为验证这一假设,团队创建了MoGen(神经元形态生成模型)。研究人员以PointInfinity点云流匹配模型为基础,训练AI将随机分布的三维点云逐步转化为逼真的三维神经元形状。利用经人工验证的小鼠皮层组织重建数据,团队以1795个轴突的表面点云为训练样本对MoGen进行了训练。为验证MoGen模拟输出的真实性,研究团队让人类专家对一组真实与模拟神经突混合的样本进行分类识别,结果显示专家无法区分真实与AI生成的样本。

研究团队随后将数百万个这类合成形状加入PATHFINDER的训练流程。

实验结果与意义

采用含10%MoGen合成数据的PATHFINDER训练模型,对预留小鼠轴突的重建错误率降低了4.4%,这一改善主要来源于合并错误率的下降,从而减少了人工专家手动修正的需求。这也标志着现代生成式AI方法首次被用于推动连接组学重建领域当前最优方法的进步。

虽然这一改善看似幅度有限,但在完整小鼠大脑的规模下,相当于为单个专家节省了157年的人工工作量。

未来展望

这一初步成果为多个潜在改进方向提供了参考。研究人员可以通过调整长度、空间范围、分叉程度等参数,引导MoGen生成特定类型的神经元。本研究生成的是随机形态样本,未来则可以重点针对容易产生重建错误的几何形状进行专项生成。此外,由于不同物种的神经元形态各有差异,团队还训练了适用于斑胸草雀和果蝇神经元的MoGen版本。研究人员也在探索利用模拟神经元生成合成电子显微镜图像,为重建流程的前期阶段提供更多训练数据。

MoGen已作为开源模型对外发布,同时附带各物种专用的训练模型,供研究社区进一步开发利用。团队相信,面对即将到来的连接组学重大项目(包括完整小鼠大脑图谱的绘制),还需要更多此类创新来突破规模与复杂性带来的挑战。

本研究感谢HHMI Janelia研究所Hess实验室的学术合作伙伴,以及Google连接组学团队的全体成员,同时向Lizzie Dorfman、Michael Brenner、John Platt和Yossi Matias在项目支持、协调与领导方面所给予的帮助致谢。

Q&A

Q1:MoGen是什么?它在大脑图谱绘制中有什么作用?

A:MoGen是Google Research开发的神经元形态生成模型,全称为Neuronal Morphology Generation。它基于PointInfinity点云流匹配技术,能够将随机三维点云逐步转化为逼真的神经元形状。MoGen的主要作用是生成大量合成神经元训练数据,用于训练AI重建模型PATHFINDER,从而降低大脑图谱重建过程中的错误率,减少人工校对工作量。

Q2:MoGen生成的合成神经元数据能将重建错误率降低多少?实际效果如何?

A:使用含10%MoGen合成数据进行训练后,PATHFINDER模型对小鼠轴突的重建错误率降低了4.4%,主要体现在合并错误率的下降。虽然这一数字看似不大,但在完整小鼠大脑的规模下,相当于节省了157人年的人工校对工作量,意义十分显著。

Q3:MoGen目前支持哪些物种的神经元生成?未来有哪些扩展计划?

A:目前MoGen已训练了针对小鼠、斑胸草雀和果蝇三种物种神经元的专用模型,并已作为开源资源对外发布。未来团队计划将MoGen聚焦于生成容易产生重建错误的特定神经元几何形态,并探索利用模拟神经元进一步生成合成电子显微镜图像,为重建流程的更早阶段提供更丰富的训练数据。

来源:Google

0赞

好文章,需要你的鼓励

2026

04/17

14:58

分享

点赞

邮件订阅