Single-cell nascent RNA sequencing unveils coordinated global transcription
转录作为基因表达的关键调控步骤,本质上是一个不连续的动态过程,其调控机制涉及核心启动子元件、转录因子和增强子,表现出短促的爆发期与较长的沉默期交替出现的特征。增强子作为远端基因组元件,在发育和疾病过程中的基因调控及细胞识别控制方面发挥着至关重要的作用。在转录过程中,增强子会转录产生非编码的增强子RNA(eRNA)。近年来的研究表明,eRNA在基因调控网络中扮演着重要角色,并且eRNA的表达具有高度的细胞类型和状态特异性,这使得eRNA有望成为诊断标志物或治疗靶点。因此,对增强子的研究对于深入理解细胞周期、发育和疾病期间的转录调控机制具有不可忽视的意义。
新生RNA(nascent RNA)是指正处于转录状态的RNA分子,通过对新生RNA的研究,科学家能够实时监测基因的转录活性,从而深入揭示转录调控的精细机制。新生RNA具有半衰期短、丰度低的特点,并且不带有Poly(A)尾,这使得从细胞丰富的总RNA中选择性地标记和富集新生RNA成为一项具有挑战性的任务。目前,常规的单细胞测序技术虽然能够揭示细胞间的异质性,但往往平均化了单个细胞内不连续的转录事件,无法精确捕获活跃的转录过程,这使得在单细胞分辨率下研究转录动力学和探讨增强子-基因关系面临诸多挑战。
2024年6月5日,来自麻省理工学院的Phillip A. Sharp研究团队在《Nature》期刊上发表了一篇题为“Single-cell nascent RNA sequencing unveils coordinated global transcription”的研究论文。文中,作者介绍了一种新型的单细胞新生RNA测序方法(scGRO-seq),该技术利用点击化学原理,能够对单个细胞的全基因组新生转录活动进行精量评估。研究团队将scGRO-seq应用于小鼠胚胎干细胞,通过深入分析,成功获得了细胞基因和增强子转录动态的全面视图,精确量化了转录爆发动力学,以及在细胞周期中难以检测到的特异性基因的转录动力学。研究发现,增强子的转录激活时间早于相关基因的转录激活。这一发现不仅填补了转录时间控制以及增强子-基因相关功能研究领域的空白,而且为深入探究细胞周期、发育和疾病中的基因调控机制提供了全新的技术平台。

一、技术原理
作者开发了一种基于点击化学(AGTuC)的全基因组转录组测序方法,适用于细胞群的新生RNA测序。该方法通过3′-(O-propargyl)-NTPs选择性标记新生RNA,偶联5′端带有AzScBc基团的DNA PCR handle,逆转录RNA-DNA偶联物并制备NGS文库。为优化该方法以应用于单细胞测序,作者进一步优化了AGTuC实验条件,确保在标记过程中不破坏核膜完整性,称为完整核AGTuC(inAGTuC)。作者利用inAGTuC测试了不同细胞核投入量下捕获新生RNA的效率,并与PRO-seq进行相关性比较,结果表明AGTuC和inAGTuC具有更高的效率、更低的成本、更短的文库制备时间和更低的样品起始量,是现有方法(PRO-seq)的可行替代方案,为单细胞新生RNA测序奠定了基础。
在此基础上,作者开发了新的化学物质应用于单细胞新生RNA测序,命名为scGRO-seq。该方法首先分离细胞核,加入3′-(O-propargyl)-nucleotides进行核run-on反应,将附有3′标记的新生RNA完整细胞核通过流式分选至含有尿素的96孔板中(尿素可裂解核膜并使RNA聚合酶变性释放标记的新生RNA),随后将带有5′-AzScBc基团的DNA接头(包含5'-AzScBc、10-12bp单细胞barcode序列、4-6bp UMI序列和PCR handle)和CuAAC MIX加入孔板中。在CuAAC作用下,炔丙基标记的新生RNA与每个孔中唯一的5′-AzScBc DNA连接形成RNA-DNA偶联物。之后合并孔板中的RNA,加入TSO序列通过M-MuLV逆转录酶进行反转录,利用Cas9去除空接头,最后进行扩增和测序。
图1 scGRO-seq流程图与验证
scGRO-seq直接测定转录爆发动力学
scGRO-seq技术能够直接测定转录爆发动力学,与传统荧光原位杂交检测转录动力学的方法不同,scGRO-seq能够以单核苷酸分辨率检测全基因组正在转录的RNA聚合酶,能够观察到RNA聚合酶在基因上的分布,反映了转录的动态过程。为了验证scGRO-seq能够揭示转录爆发的过程,作者设计了一个无偏倚的模型,量化转录RNA聚合酶的发生频率,结果发现,在真实数据中出现更高的多聚体,表示多个RNA聚合酶同时转录,同时分析了多聚体之间的距离分布发现,真实数据中多聚体具有更紧密的RNA聚合酶分布,进一步说明了scGRO-seq能够捕获到转录爆发现象。作者通过scGRO-seq数据直接测定了转录爆发的动力学参数,比较发现scGRO-seq与内含子seqFISH所得爆发频率数据具有良好相关性,同时发现核心启动子元件和转录因子可以调节转录爆发参数。
综上所述,scGRO-seq能够直接和全面地观察转录爆发,有助于在单细胞水平上研究转录动力学。该技术通过量化新生RNA和RNA聚合酶,提供了对单个细胞内转录活动的详细评估,不仅能够揭示转录爆发的大小和频率,还可以利用复制依赖性非多聚腺苷酸化组蛋白基因转录来阐明细胞周期动力学。此外,scGRO-seq的单核苷酸空间和时间分辨率能够识别增强子和基因网络,为深入探究细胞周期、发育和疾病中的基因调控机制提供了新的技术平台。
图2 scGRO-seq推断转录动力学
scGRO-seq推断组蛋白基因的细胞周期
目前,传统的单细胞RNA测序(scRNA-seq)方法在确定细胞周期状态时存在局限性。大多数scRNA-seq方法依赖于poly(A)尾进行捕获和测序,因此无法检测到在S期特异性转录且无poly(A)尾的复制依赖性组蛋白基因。此外,这些基因在S期高度特异性表达,在样本制备过程中可能存在时间滞后,导致难以及时检测到特异性基因表达。为了解决这些问题,作者开发了scGRO-seq技术,利用该技术对小鼠胚胎干细胞进行实验,发现scGRO-seq能够检测到组蛋白位点体中复制依赖性组蛋白基因的活性转录,并对S期细胞进行分类。通过不同细胞周期特异性基因表达的分层聚类,揭示了单个细胞的三个重要簇,这些簇代表了细胞周期不同阶段的比例。不同细胞周期阶段的转录水平存在差异,对细胞周期阶段差异表达基因的分析显示,细胞在DNA复制过程中虽然转录水平降低,但会持续进行,且不同基因存在不同的转录循环模式。综上所述,scGRO-seq技术能够揭示整个细胞周期的动态转录程序,为研究细胞周期中的基因调控提供了新的工具和视角。
图3 scGRO-seq推断组蛋白基因的细胞周期
相互依赖基因的共转录
作者利用scGRO-seq技术探究功能相关基因在稳态下的共转录现象,通过可视化方法展示两个基因在单细胞水平的共转录关系,提示它们可能存在时间或功能上的关联,如受相同转录因子调控或参与同一生物学过程。对转录过程中共表达的基因对进行分析,发现共转录基因对在细胞周期调控、RNA剪接、翻译控制等生物学过程中富集。将scGRO-seq获得的共转录基因对与内含子seqFISH比较共转录相关性,发现两者具有高度相似的共转录谱。
综上所述,scGRO-seq凭借其高通量优势,能够直接检测基因对或基因网络之间的转录协调性,为基因组功能研究提供了重要工具。
图4 功能相关基因的协调转录
基因时间协调
作者利用scGRO-seq技术深入探究了基因和增强子之间的时间协调性。通过分析基因前10 kb内的scGRO-seq读段以及增强子周围向外转录的每条链上至少3 kb的读段,研究发现增强子-基因共转录主要在200 kb范围内显著富集。进一步分析表明,当功能相关的基因在同一条染色体上聚集时,多个增强子与每个基因相关,这可能是细胞周期调控的进一步作用结果。为了验证增强子的转录可能在其靶基因启动子转录之前开始的假设,作者通过CRISPR干扰验证了多个增强子bin与基因之间的相关性,发现相关的增强子bin通常比基因bin距离其转录起始位点(TSS)更远,这意味着增强子转录可能在启动子转录之前开始。
综上所述,scGRO-seq技术初步验证了增强子转录可能在启动子转录之前开始,但这一时间模式对增强子-基因转录调控的具体影响仍需进一步深入探究。scGRO-seq凭借其高通量和单细胞分辨率的优势,能够直接检测基因对或基因网络之间的转录协调性,为基因组功能研究提供了重要工具。通过这种技术,研究人员可以更精确地揭示基因表达的调控机制,特别是在细胞周期、发育和疾病等生物学过程中基因和增强子之间的复杂相互作用。
图5 基因与增强子之间的时间协调
二、总结
scGRO-seq技术通过点击化学方法,能够不依赖于Poly(A)尾检测新生RNA,利用CuAAC可以捕获约10%的新生RNA。作者通过点击化学取代了多轮新生RNA纯化和核酸连接,优化了实验步骤,增加了高通量液滴封装捕获效率,扩展了scGRO-seq的适用性。
scGRO-seq本质上是多模态的,是一个可以深入详细地理解转录调控的工具,它可以在天然环境中评估共转录和预测增强子-基因调控网络。文中作者已验证scGRO-seq可以确定表达基因的突发大小和频率、细胞周期阶段的转录动力学以及全基因组基因-基因和增强子-基因共转录检测等功能。
然而,目前的scGRO-seq仍具有一定局限性。通过低sarkosyl浓度实现的核完整性的保持未能促进暂停复合物中RNA聚合酶的运行,从而限制了启动子-近端暂停聚合酶的检测。在读取深度和细胞数量方面也限制了对基因-基因和增强子-基因对的爆发动力学和共转录的分析。但尽管存在这些局限性,scGRO-seq的适应性和效率为研究不同生物学背景下的转录动力学和调控机制提供了新的途径,丰富了对基因表达调控及其在生理和病理条件下的影响的理解。
名称 |
货号 |
规格 |
MAXIMA H MINUS REVERSE |
EP0751 |
TRANSCRIPTASE |
GFP ANTIBODY |
A11122 |
100UL |
mAxl Aff Pur PAb (100 ug) |
AF854 |
100ug |
mAxl Aff Pur PAb (25 ug) |
AF854-SP |
25ug |