首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Commun. | 用于单细胞多组学轨迹解析的原型速度建模框架

Nat. Commun. | 用于单细胞多组学轨迹解析的原型速度建模框架

作者头像
DrugAI
发布2026-06-11 19:41:00
发布2026-06-11 19:41:00
10
举报

DRUGONE

单细胞测序技术能够提供细胞状态的静态快照,但如何从这些静态数据中重建细胞动态演化过程仍是基因组学领域的重要挑战。研究人员开发了ArchVelo,一种基于单细胞染色质开放性(scATAC-seq)与转录组(scRNA-seq)联合分析的轨迹推断框架。该方法利用“原型(archetype)”表示共享的染色质调控程序,并将其整合进基因转录动力学模型,从而刻画染色质状态对基因表达的动态调控作用。

在小鼠胚胎脑和人造血系统数据集上的系统评测表明,ArchVelo在轨迹推断准确性、基因潜在时间一致性以及细胞命运方向预测方面均优于现有主流RNA velocity方法。此外,该框架能够将复杂轨迹分解为多个具有生物学意义的调控组分,并进一步识别驱动这些组分的关键转录因子。研究人员随后将ArchVelo应用于病毒感染过程中CD8 T细胞的多组学数据分析,揭示了细胞分化与细胞增殖两条相互独立的动态轨迹,并发现了一条此前未被描述的Ccr6⁻祖细胞向Ccr6⁺祖细胞转变的新型分化路径。ArchVelo为多组学单细胞数据中的基因调控建模和细胞轨迹推断提供了统一且可解释的新框架。

单细胞RNA测序已经成为解析细胞异质性的重要工具。通过测量数千个基因在单个细胞中的表达水平,研究人员能够识别不同细胞类型、细胞状态以及细胞命运转换过程。然而,传统轨迹推断方法主要依赖细胞间表达相似性构建无向图,再通过伪时间分析推测发育过程,因此难以准确确定细胞状态变化的方向。

RNA velocity方法的出现为解决这一问题提供了新的思路。该方法利用未剪接RNA与已剪接RNA之间的比例关系推断基因表达变化趋势,从而获得细胞未来状态的方向信息。但RNA velocity主要基于转录本层面的信息,对驱动基因表达变化的上游调控机制关注较少。

随着单细胞多组学技术的发展,研究人员能够同时测量同一细胞中的染色质开放状态和基因表达水平。相比基因表达,染色质开放性更直接反映转录因子结合和调控元件活性,因此有望提供更准确的细胞动态信息。然而,scATAC-seq数据具有高维度、高稀疏性以及复杂调控关系等特点,使得其建模远比RNA表达更加困难。

已有方法通常将与某个基因相关的所有开放染色质区域简单求和,作为该基因的调控输入。但实际上,一个基因往往受到多个增强子和启动子的协同调控,这些元件可能响应不同的上游信号。因此,简单求和会掩盖真实的调控结构。研究人员认为,需要建立一种能够保留不同调控程序信息的新型表示方式,以提高轨迹推断的准确性和可解释性。

方法

ArchVelo的核心思想是利用原型分析(Archetypal Analysis)对scATAC-seq数据进行降维与解构。研究人员认为,不同细胞中的染色质开放模式可以被少数几个具有代表性的“原型调控程序”所描述。每个细胞的染色质状态都可以表示为这些原型的组合,而每个开放染色质位点则对应不同原型的贡献权重。

在此基础上,研究人员构建了一个新的动力学模型。模型不仅描述RNA转录、剪接和降解过程,还同时引入染色质开放状态的动态变化。对于每个基因,转录活性不再由单一染色质开放值决定,而是由多个原型调控程序共同驱动。通过这种方式,ArchVelo能够同时利用染色质开放性和转录组信息推断细胞状态变化方向,并进一步解析不同调控程序在轨迹形成中的贡献。

结果

原型分析显著提升ATAC与RNA之间的关联建模能力

研究人员首先评估了原型表示是否能够更好地描述染色质开放性与基因表达之间的关系。

结果表明,相较于传统基因活性评分方法以及基于所有调控峰直接建模的方法,利用原型表示建立的线性模型具有更高的RNA表达预测能力。同时,该方法甚至优于此前提出的深度学习模型BABEL。这说明原型分析能够有效提取染色质调控信息,为后续动力学建模提供更加稳定且具有生物学意义的特征表示。

图1 原型分析构建单细胞多组学调控表示。

ArchVelo建立基于原型调控程序的基因表达动力学模型

在获得原型表示后,研究人员进一步将其整合到RNA velocity框架中。不同于MultiVelo将所有调控峰简单聚合的方法,ArchVelo允许每个原型调控程序以不同强度影响基因转录速率。这样,一个基因可以同时受到多个调控程序驱动,从而更符合真实生物系统中的复杂调控网络。

该模型能够同时推断染色质开放、转录启动、RNA剪接以及RNA降解等多个过程的动力学参数,为轨迹分析提供更加丰富的调控信息。

图2 ArchVelo动力学模型框架。

在小鼠胚胎脑发育中实现更准确的轨迹推断

研究人员首先在小鼠胚胎脑多组学数据中测试ArchVelo。分析识别出神经祖细胞、中间祖细胞、迁移神经元、深层神经元、浅层神经元、星形胶质细胞前体等多个发育阶段。ArchVelo成功恢复了神经元与胶质细胞两条主要分化路径,并正确区分深层与浅层神经元发育谱系。

相比现有方法,ArchVelo在基因表达动力学拟合、潜在时间一致性以及细胞状态转换方向预测方面均表现更优。其推断结果与已知神经发育过程高度一致。

图3: 小鼠胚胎脑发育轨迹分析。

在人造血系统中重建复杂分化谱系

随后,研究人员将ArchVelo应用于人造血干细胞分化数据。

结果成功重建了从多能造血干细胞向粒细胞、单核细胞、树突状细胞、红细胞、巨核细胞以及嗜碱性粒细胞等多个谱系的分化过程。ArchVelo推断得到的轨迹与经典造血分化模型高度吻合。

定量评估显示,ArchVelo在基因层面的模型拟合质量和潜在时间稳定性方面均优于现有方法,同时在谱系方向预测准确率上取得最高分数。

图4: 人造血干细胞分化轨迹重建。

原型分解揭示隐藏的调控程序

ArchVelo最具特色的功能之一是轨迹分解。由于模型中的转录动力学由多个原型共同驱动,因此整体速度场可以被拆分为多个原型特异性的速度分量。每个分量对应一种独立的调控程序。

在小鼠脑发育数据中,研究人员发现两个表面上高度重叠的细胞群体实际上受到不同调控程序支配。其中一个原型主要与细胞周期相关基因表达有关,反映细胞增殖过程;另一个原型则与星形胶质细胞分化相关,驱动细胞命运决定。

这种分解能力使研究人员能够将增殖与分化等同时发生的生物学过程区分开来,从而获得更清晰的动态解释。

图5: 原型速度场分解揭示不同调控程序。

识别驱动造血分化的关键转录因子

在造血系统中,原型分解进一步揭示了不同谱系背后的调控机制。

研究人员发现,不同原型分别对应巨核细胞、红细胞以及嗜碱性粒细胞谱系分化。通过转录因子基序分析,成功识别出与这些轨迹相关的关键调控因子。

例如,与巨核细胞分化相关的原型富集FLI1相关基序;与嗜碱性粒细胞相关的原型富集GATA2;而红细胞分化轨迹则对应GATA家族和KLF1调控程序。这些结果与已有生物学知识高度一致。

图6: 原型轨迹对应的转录因子调控网络。

揭示病毒感染过程中CD8 T细胞的分化与增殖轨迹

研究人员随后分析LCMV急性感染与慢性感染中的CD8 T细胞响应过程。

结果识别出效应细胞、记忆样细胞、耗竭前体细胞以及多个增殖细胞亚群。ArchVelo发现,细胞周期进程和功能分化实际上对应两条近乎正交的动态轨迹。

其中,一条轨迹主要反映细胞增殖状态变化;另一条轨迹则对应效应细胞向记忆样和祖细胞状态的功能分化过程。这种双轨迹结构在急性感染和慢性感染中均存在。

图7: 病毒感染过程中CD8 T细胞的动态轨迹。

发现Ccr6⁻祖细胞向Ccr6⁺祖细胞转变的新轨迹

在进一步聚焦Tcf1阳性祖细胞群体后,研究人员发现该群体实际上可以进一步划分为Ccr6⁻和Ccr6⁺两个亚群。

ArchVelo推断表明,Ccr6⁻祖细胞是更加早期的状态,而Ccr6⁺祖细胞则代表进一步分化阶段。两种感染模式中均存在从Ccr6⁻向Ccr6⁺转变的连续轨迹。

转录因子分析显示,Ccr6⁻阶段富集Smad和E2f相关调控程序,提示其保持较高增殖潜力;而Ccr6⁺阶段则富集Nfat和Nr4a家族调控程序,与T细胞活化和效应分化密切相关。

这一结果揭示了一条此前未被报道的祖细胞分化路线,为理解免疫应答持续性和免疫治疗反应机制提供了新的视角。

图8: Ccr6⁻祖细胞向Ccr6⁺祖细胞的分化轨迹。

讨论

本研究提出的ArchVelo将染色质开放性原型表示与RNA velocity动力学模型有机结合,实现了单细胞多组学数据中的高精度轨迹推断。研究表明,利用原型分析能够有效缓解ATAC数据高稀疏性问题,并为基因调控建模提供稳定、可解释的调控基础。与现有方法相比,ArchVelo不仅提高了轨迹推断准确性,还能够将复杂轨迹分解为多个调控程序,从而直接揭示驱动细胞状态转换的潜在机制。

研究人员认为,该框架未来可以进一步扩展到非配对单细胞数据、群体ATAC数据以及更复杂的调控网络建模场景。同时,目前模型仍采用染色质开放性与转录活性之间的线性映射关系,而真实生物系统中往往存在协同调控和非线性增强子逻辑,因此未来有望引入更复杂的神经网络或概率图模型进一步提升生物学真实性。

总体而言,ArchVelo不仅是一种更准确的RNA velocity方法,更提供了一种从“细胞轨迹”走向“调控轨迹”的全新研究范式。通过同时解析细胞状态变化与其背后的调控程序,该框架为发育生物学、免疫学、肿瘤学以及多组学单细胞研究提供了重要工具。

整理 | DrugOne团队

参考资料

Avdeeva, M., Walker, S.K., van der Veeken, J. et al. ArchVelo: archetypal velocity modeling for single-cell multi-omic trajectories. Nat Commun (2026).

https://doi.org/10.1038/s41467-026-74000-4

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档