RNA-seq 可变剪切

可变剪切定义

有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接, alternative splicing)

内含子剪切需要区分外显子和内含子,主要识别包括内含子5‘及3’末端序列即中间分支点(branch site)附近序列。5‘剪切点称为供体点(donor site),3’剪切点称为受体点(acceptor site)。内含子开始和末尾的碱基最为保守,为GU-AG(约占99.24%),少数为GC-AG(0.7%),极少数为(AT-AC)

剪切由剪切体催化完成,剪切体主要有几个糖蛋白亚基组成。每个亚基由RNA链和蛋白质组成,剪切体分为主要剪切体(major spliceosome)和次要剪切体 (minor spliceosome),主要剪切体负责对接GU-AG的形式,次要剪切体对接AT-AC的形式,剪切过程就是U1结合donor site,U2结合branch site ,U4-U5-U6 形成复合物去绑定链接到U1-U2上,最终完成剪切。


可变剪切种类主要可以分为以下五类:

可变剪切分析软件

RNA-seq可变剪切一般分析过程:

比对软件:hisat2、 star、 tophat

AS识别软件:依赖已有的gtf文件,Asprofile、rmats、cash,不依赖的有leafcutter

AS差异分析:定量再进行差异表达分析

推荐软件:cash/rMATS

CASH 可变剪切分析

下载路径:https://sourceforge.net/projects/cash-program/

Released /2.2.1/cash_v2.2.1.zip

unzip cash_v2.2.1.zip

cd cash_v2.2.1

要求:Java version ≥ 1.8   自行安装:https://www.java.com/en/download/help/linux_x64_install.xml

java –jar cash.ja

运行脚本

无生物学重复:

java -jar -Xmx10g cash.jar --Case:prefix1 C1.bam --Control:prefix2 C2.bam --GTF ref.gtf—Output sample

有生物学重复:

java-jar -Xmx10g cash.jar --Case:Control C1.bam,C2.bam --Control:Treat T1.bam,T2.bam --GTF ref.gtf--Output samples

~/bio/jdk1.8.0_201/bin/java -jar -Xmx10g ~/bio/cash/cash.jar --Case:Mutation ~/testData/bams/C1.bam,~/testData/bams/C.bam --Control:WildType ~/testData/bams/W1.bam,~/testData/bams/W2.bam --GTF ~/ref/hg19.gtf --Output test

结果文件解读:

文件1:test.ControlvsTreat.alldiff.statistics.txt 主要是统计分析结果

文件2: test.MutationvsWildType.alldiff.txt 具体剪切信息文件

rMATS可变剪切分析

Multivariate Analysis of Transcript Splicing (MATS)  4.0版本以上的,不支持没有生物学重复的差异分析

下载: http://rnaseq-mats.sourceforge.net/rmats4.0.2/

Release of rMATS 4.0.1(建议下载版本,最新4.0.2版本运行时候bugs可能较多)

安装相关需求包,有root权限按照官方指南安装,没有的安装如下:

User Guide http://rnaseq-mats.sourceforge.net/rmats4.0.1/user_guide.htm

利用 conda 安装 numpy ,libblas, liblapack,gfortran (https://anaconda.org/bioconda/)

libgsl0ldbl包需要自行编译

先去官网下载GSL安装包http://www.gnu.org/software/gsl/

下载最新的版本后解压,在解压后的目录执行

./configure --prefix=/usr/local/bin && make && make install

cd /usr/local/bin

vi ./bashrc 添加路径

最下面加入:

export LD_LIBRARY_PATH=/usr/local/bin: $LD_LIBRARY_PATH

source ./bashrc

找到编译的路径,建立软连接

cd /usr/local/bin      

ln libgsl.so.23 libgsl.so.0

脚本运行

fastq文件运行

python rmats.py --s1 s1.txt --s2 s2.txt --gtf gtfFile --bi STARindexFolder -od outDir -t readType -readLength readLength [options]*

python rMATS-turbo-xxx-UCSx/rmats.py --s1 s1.txt --s2 s2.txt --gtf gtf/Homo_sapiens.Ensembl.GRCh37.72.gtf --bi ~/STARindex/hg19 --od out_test -t paired --nthread 6 --readLength 101 --tophatAnchor 8 --cstat 0.0001 --tstat 6

s1及s2的文件为两个样品的fastq文件路径

bam文件运行

python rmats.py --b1 b1.txt --b2 b2.txt --gtf gtfFile --od outDir -t readType --nthread nthread --readLength readLength --tstat tstat [options]*

python rMATS-turbo-xxx-UCSx/rmats.py --b1 b1.txt --b2 b2.txt -gtf gtf/Homo_sapiens.Ensembl.GRCh37.72.gtf -od bam_test -t paired --readLength 101 --cstat 0.0001 --libType fr-unstranded

b1.txt和b2.txt文件为两个样品的bam文件路径

结果文件解读

输出五种可变剪接类型输出:可变剪接类型.MATS.JCEC.txt 考虑外显子长度 可变剪接类型.MATS.JC.txt 不考虑外显子长度



rmats2sashimiplot 可视化rmats分析结果

下载链接:https://github.com/Xinglab/rmats2sashimiplot

python2.7下安装python setup.py install (需安装python画图包matplotlib)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容