环形RNA是一类在真核生物中广泛存在的具有特殊环状结构的非编码RNA分子。已有文献表明,在生物体内,环形RNA有着miRNA海绵、RBP海绵以及翻译短肽等多项功能,在许多生物学过程中发挥着重要作用。
目前研究表明,大部分环形RNA来源于蛋白编码基因的外显子区域。在pre-mRNA剪接的过程中,除典型的内含子剪接事件外,还可能会发生5’端到3’端的反向剪接事件,从而形成环形RNA。因此,剪接产物中环形RNA所占比例是环形RNA分析的重要指标之一,具有高成环比例的环形RNA分子,可能具有更加重要的生物学功能。
同时,同一基因内部也可能产生多种不同的环形RNA,基因内对环形RNA产生位点的使用偏好,也在一定程度上反映了转录过程对环形RNA产生的调控。因此,环形RNA转录本水平的准确定量,是目前环形RNA分析的重要基础。
看了几篇目前植物里面发表的环形RNA的文章,大多数定量还是采用类似基因定量的方法,比如FPKM。不过不同的是这个reads用的是反向剪切的reads个数。也有一些文章,利用的是反向剪切和linear RNA上reads的比例。
2020年1月3日,中国科学院北京生命科学研究院赵方庆团队在《自然-通讯》(Nature Communications)杂志上发表题为Accurate quantification of circular RNAs identifies extensive circular isoform switching events的文章。该研究开发了环形RNA定量和差异表达分析的新方法:CIRIquant,流程如下图所示。与常用的环形RNA分析软件相比,CIRIquant可以更准确对环形RNA转录本进行识别和定量,并为环形RNA的差异表达分析提供了便捷的一站式分析工具。
===下载和安装====
地址:https://github.com/bioinfo-biols/CIRIquant
注: Only python2 is supported
可以通过pip安装:
pip install CIRIquant
也可以通过源码自己安装:
pip install -r requirements.txt
python setup.py install
====用法====
从用法上可以看出,CIRIquant支持一些常用circRNA鉴定软件的输出结果:通过参数–circ 和–tool 实现。
当然,也可以输入bed格式的circRNA鉴定结果,通过--bed参数实现。格式如下所示,其中第四列必须是:“chrom:start|end” 。
====测试======
比如利用前面CIRI2的输出:
CIRIquant -t 30 --config all.config -o tets -p test -1 CK_0_1_1.fq.gz -2 CK_0_1_2.fq.gz --tool CIRI2 --circ ../CIRI2/CK_0_1
all.config:
输出的结果在gtf中:
每一列的含义如下表所示:
可以看出第6列是最后给出的score值,也就是CPM值。
其中attributes里面也给你出了type,bsj,fsj以及junc的ratio信息。
当然也可以以bed的格式输入:
CIRIquant -t 30 --config all.config -o tets -p test -1 CK_0_1_1.fq.gz -2 CK_0_1_2.fq.gz --bed test.bed
所以,我们可以把集中方法的结果合并为bed格式,一起定量。
本文使用 文章同步助手 同步