lncRNA数据处理(get fasta>>>novel lncRNA)))

情况说明:我有两个实验,每个实验两个重复,我现在要鉴定到新的lncRNA之后进行差异分析。大体思路,我会先通过常规的鉴定novel lncRNA方法鉴定到新的转录本,将转录本与参考基因组的转录本合并,之后进行定量分析。因此,我之前处理好各个文件的接头序列之后比对基因组后,会将四个bam文件合并成一个,之后进行鉴定(通过length、fpkm、cov、编码能力预测)之后会将鉴定到的转录本合并(与基因组的转录本),使用RSEM定量

使用到的软件有--fastQC、fastp、STAR、stringtie、cuffcompare、cpc(cpc2)、CNCI、CPAT、


1.常规的数据处理步骤

    1)拿到数据后先进行质检(常用fastqc看测序质量、用fastp做处理去接头什么的)

        fastqc -t 4 ` ls * `

         fastp -i ${file}-r1.fastq.gz -o ${file}-f.r1.fastq.gz -I ${file}-r2.fastq.gz -O ${file}-f.r2.fastq.gz -Q --thread=5 -5 --detect_adapter_for_pe 2> ${file}.log

            ###${file}是我用for循环做的变量(这里应该是你的测序文件,PE150双端150bp测序,所以会有两个文件,分别是r1和r2。fastp软件使用可以直接看manual ,比较杂,我主要用了其中的去接头处理,关闭质量过滤”Q” 2>log文件是使用该软件处理过程中生成的日志。

    2)开始进行比对(根据物种来选择一个合适的比对软件,植物多倍体推荐bwa,STAR,我用的是STAR,大体参数有这些

        STAR --runThreadN 20 \

#        --outSAMmapqUnique 60 \

#        --twopassMode Basic \

#        --outSAMtype BAM SortedByCoordinate \

#        --limitBAMsortRAM 200000000000 \

#        --outFilterMultimapNmax 1 \

#        --outSAMprimaryFlag AllBestScore \

#        --outReadsUnmapped Fastx \

#        --outFilterMatchNmin 50 \

#        --alignMatesGapMax 10000 \

#        --outSAMstrandField intronMotif \

#        --outFilterMismatchNoverLmax 0.03 \

#        --outFilterType BySJout \

#        --readFilesCommand zcat \

#        --alignSoftClipAtReferenceEnds No \

#        --alignEndsType Local \

#        --alignIntronMin 20 \

#        --alignIntronMax 15000 \

#        --outSAMattributes All \

#        --outFilterMismatchNoverReadLmax 0.02 \

这个参数比较多,但实际应用的时候可以相应减少,其实很多时候默认参数就可以,发文章的时候默认参数比较有说服力。

--runThreadN 20 --genomeDir $index \

        --readFilesIn ${name}_1P.fq.gz ${name}_2P.fq.gz \

        --outReadsUnmapped Fastx \

        --readFilesCommand zcat \

        --outSAMtype BAM SortedByCoordinate \

        --outFileNamePrefix ./${name}_star/${name}

###这是我用的参数,仅供参考,我是为了之后找lncRNA

    3)比对完之后要进行组装,有cufflinks stringtie等,此处用的是stringtie

"""stringtie -p 4 -G ref-genome.gtf -o output.gtf input_file """

    ###有的是在这里会将多个组装好的gtf文件merge到一起,可以使用stringtie 的merge

    4)使用cuffconpare进行分类

""" cuffcompare -r ref-genome.gtf  -o output input_file """

       ###会从中得到好多文件,一般我们会从*.tmap文件中进行筛选

"""awk '{if($7>=0.5 && $10 > 1 && $11 >200) print $0}' 自己命名的.tmap |awk '{if ($3=="u" || $3=="x" || $3=="i" || $3=="j" || $3=="o"){print $0}}' > newfile.gtf 

       ###其中$7是fpkm值、$10是cov值、$11是length ,使用管道直接筛选出$3是u、x、i、j、o的code,具体的分类值可以从cuffcompare的manual看到

    5)到了写脚本的时候啦,要做的有,从上一步筛选到的转录本的到它的转录本序列(我是得到它的每个转录本有多少个exon,位置是多少,从已知基因组中得到序列后将其合并到一起,形成转录本序列,之后进行coding potential calculator(CPC)CNCI等软件来做,CPC我是安装到liunx 本地的,

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342