LncRNA的概念及功能
LncRNA的概念
长链非编码RNA(long non-coding RNA, LncRNA)是一类长度大于200nt但不编码蛋白质的非编码RNA,广泛分布于动植物中。最初,LncRNA被视为基因组转录的“噪音”,是RNA聚合酶II(Pol II)转录的附属产物。尽管大多数LncRNA由Pol II转录,但也存在其他RNA聚合酶的转录。LncRNA可源自基因间区域(lincRNA)或与其他基因重叠的有义或反义转录本。许多LncRNA具有5'端m7G帽和3'端poly(A)尾,类似于mRNA的转录和加工过程。其表达呈现明显的组织特异性和时空特异性。
LncRNA的功能
最初,研究者们认为LncRNA不具备生物学功能。然而,随着后续大量研究的进行,已经发现许多LncRNA参与生物体内多种基因调控。目前已知的LncRNA功能可总结如下:
1)转录干扰:在编码蛋白的基因上游启动子区进行转录,干扰下游基因的表达;
2)诱导染色质重构和核小体修饰:抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因的表达;
3)调控可变剪接模式:与编码蛋白基因的转录本形成互补双链,干扰mRNA的剪切,形成不同的剪切形式;
4)产生内源siRNAs:与编码蛋白基因的转录本形成互补双链,在Dicer酶的作用下产生内源性siRNA;
5)调控蛋白质的活性:与特定蛋白质结合,LncRNA转录本可调节相应蛋白的活性;
6)结构或组织功能:作为结构组分与蛋白质形成核酸蛋白质复合体;
7)改变蛋白质的定位:结合到特定蛋白质上,改变该蛋白质的细胞定位;
8)小RNA的前体:作为小分子RNA(如miRNA、piRNA)的前体分子。
LncRNA的研究历程
传统转录组测序研究LncRNA的局限性
近年来随着单细胞转录组测序(scRNA-seq)的快速发展,科研工作者可以在单个细胞水平进行更细致的基因表达解析,从而更准确地解析组织中的基因调控变化。然而,目前大多数的scRNA-seq方法以使用polyT探针引物捕获mRNA为基础,所以只能检测样本中的大部分mRNA,以及部分带ployA尾的LncRNA,而超过半数的LncRNA没有ployA结构。因此,目前对LncRNA的研究还普遍只能使用传统的Bulk LncRNA测序(即对整个组织进行RNA提取然后开展测序)。
此外,基于Bulk的传统组学检测在非编码RNA的分析方面带来一系列误差,以ceRNA分析为例。ceRNA效应描述了两条RNA(或者更多RNA)有相同的miRNA结合位点时,它们就会竞争性地结合相同的miRNA,从而呈现表达量正相关的现象。具体来讲,LncRNA X和mRNA Y都可以竞争性地结合miRNA Z。当LncRNA X的表达量升高时,它可以竞争性地结合并消耗更多的miRNA Z,使得更多的mRNA Y从miRNA Z的抑制中解放出来,进而导致mRNA Y的丰度增加。反之亦然,如果LncRNA X的表达量降低,miRNA Z对mRNA Y的抑制效果将增强,导致mRNA Y的丰度减少。通过ceRNA效应,非编码RNA(包括LncRNA和circRNA)可以间接调控mRNA的丰度,这是非编码RNA的一种常见功能调控机制。
基于以上的逻辑,ceRNA关系分析建立在两点基础上:(1)非编码RNA与mRNA都可以与相同的miRNA结合;(2)非编码RNA与mRNA表达量正相关。
以上两点逻辑看起来很严谨,但基于以上生物信息分析得到的结论在后续的分子实验中常常无法被成功验证,即生物信息的结果是假阳性。
这是因为Bulk RNA-seq是样本均一化后的表达量检测,所以我们无法判断具有相关性的LncRNA与mRNA是否在同一类细胞中表达,那么两个RNA分子组织水平的平均表达相关性无法作为它们之间存在调控关系的严格证据。
单细胞转录组研究LncRNA的必要性
综上所述,针对非编码RNA的分析,我们迫切需要在单细胞层面进行深入解析。当前,已经出现了一些解决方案,可以克服对非ployA RNA的检测限制。其中包括基于三代测序的全长单细胞转录组测序技术,以及单细胞全序列转录组测序技术。后者通过半随机引物对各种类型的RNA进行捕获和测序,不依赖ployA结构,从而实现对单细胞水平的非编码RNA的全面检测。该单细胞全转录组技术利用随机引物捕获全长序列转录本,使我们能够获取同一细胞内RNA分子的表达情况。基于上述内容,这项技术对于单细胞级别的全转录组研究的重要性不言而喻。
单细胞水平下的LncRNA研究进展
单细胞全序列转录组简介
单细胞全序列转录组测序实现了单细胞级别的全长覆盖检测,采用了12N7K半随机引物捕获RNA的方案,取代了常规单细胞转录组依赖于3' polyA的捕获方案,从而突破了仅能检测靠近mRNA 3'或5'序列的传统限制。同时,通过使用blocker对mt-rRNA和rRNA进行block,有效减少了数据的浪费。
这项单细胞全序列转录组研究仍然属于转录组学范畴,具有出色的基因表达检测能力。此外,该技术检测到的数据表现出强大的稳定性,对不同批次制备的相同组织样本进行检测,显示出数据相关性高、批次效应小、分群结果高度相似的特点。
相较于3’转录组,全序列转录组能够捕获更多的非编码RNA,有助于深入研究非编码RNA调控网络的机制。
单细胞全序列转录组研究LncRNA的优势
2023年3月,一篇题为《High throughput detection of variation in single-cell whole transcriptome through streamlined scFAST-seq》的预印本文章在bioRxiv平台上发布。该研究提出了一种新的单细胞全转录组测序方法,即scFAST-seq,具有以下特点:
1)scFAST-seq将半随机引物与高效的逆转录、模板切换以及rRNA去除方法相结合,能够在短时间内构建多达12,000个细胞的全长RNA文库。
2)与常规的3'单细胞RNA测序相比,scFAST-seq在mRNA检测灵敏度、测序成本和实验工作流程等方面表现出类似的优势。
3)scFAST-seq在检测不带有poly-A尾的转录本、覆盖更长的转录本长度以及识别更多splice junctions等方面具有明显的技术优势。
4)该方法能够更准确地预测细胞的分化方向。
5)结合靶向区域富集技术,scFAST-seq可以同时鉴定单个肿瘤细胞的体细胞突变和细胞状态。
单细胞转录组测序下LncRNA的研究现状
2023年,Circulation杂志在线发表了一篇题为《Assessment of the Cardiac Noncoding Transcriptome by Single-Cell RNA Sequencing Identifies FIXER, a Conserved Profibrogenic Long Noncoding RNA》的研究论文。该研究通过单细胞RNA测序对心脏非编码转录组进行全面评估,成功鉴定出一个保守的促纤维化长链非编码RNA,命名为FIXER。该发现可能代表了一种新的治疗靶点,为研究心脏纤维化提供了新的突破。
2023年,Nature Communications期刊发表了一篇题为《Single-cell profiling of lncRNA expression during Ebola virus infection in rhesus macaques》的研究文章。该研究通过在单细胞水平上进行lncRNA表达分析,深入研究了在恒河猴感染埃博拉病毒(EBOV)期间,lncRNA的表达模式变化。研究发现,这些lncRNAs呈现出与蛋白质编码基因相似的表达模式,通常与已知的免疫调节因子共表达。有一些lncRNAs在EBOV进入细胞时表现出特异性的表达变化,为深入理解埃博拉病毒感染的免疫调控机制提供了新的视角。
2021年,Genomics, Proteomics & Bioinformatics期刊上发表了一篇题为《Single-cell Long Non-coding RNA Landscape of T Cells in Human Cancer Immunity》的研究文章。研究团队利用来自3种癌症类型不同组织的20,000多个T细胞单细胞全长转录组数据,创建了一个完整的T细胞lncRNA数据集,并分析了与不同T细胞状态相关的功能,为探索lncRNA在肿瘤T细胞中的调控机制提供了丰富的数据资源。
小结
迄今为止,大多数LncRNA的研究主要依赖于Bulk RNA测序数据。然而,这种方法所得到的信息仅能计算各种不同细胞类型的平均信号。这一限制既阻碍了对细胞特异性LncRNA功能的深入挖掘,也可能忽略一些重要的LncRNA。scRNA-seq为克服这一问题提供了潜在的解决方案。尤其是单细胞全序列转录组测序在对比三代全长测序通量低且价格昂贵时具有显著的优势。当然,全转录组测序并非没有缺点,其对于低丰度转录本的捕获效率和稳定性仍存在一定挑战。
总体而言,单细胞全转录组测序为研究LncRNA提供了一种高分辨率和全景的途径,有助于揭示LncRNA在细胞类型、生物发育和疾病进展阶段等过程中的表达与功能调控。然而,未来仍需克服一些技术和数据处理上的挑战,这需要该领域的技术人员投入相应的资金和时间。
[参考文献]
[1] Santus L, Sopena-Rios M, García-Pérez R, et al. Single-cell profiling of lncRNA expression during Ebola virus infection in rhesus macaques. Nat Commun. 2023;14(1):3866. Published 2023 Jun 30. doi:10.1038/s41467-023-39627-7IF: 16.6 Q1
[2] Luo H, Bu D, Shao L, et al. Single-cell Long Non-coding RNA Landscape of T Cells in Human Cancer Immunity. Genomics Proteomics Bioinformatics. 2021;19(3):377-393. doi:10.1016/j.gpb.2021.02.006IF: 9.5 Q1
[3] Aghagolzadeh P, Plaisance I, Bernasconi R, et al. Assessment of the Cardiac Noncoding Transcriptome by Single-Cell RNA Sequencing Identifies FIXER, a Conserved Profibrogenic Long Noncoding RNA. Circulation. 2023;148(9):778-797. doi:10.1161/CIRCULATIONAHA.122.062601IF: 37.8 Q1
[4] High throughput detection of variation in single-cell whole transcriptome through streamlined scFAST-seq