插件 | Hisat2+StringTie 本地界面化(Win/Mac),点点点,完成转录组数据分析

写在前面

早前,我已经通过插件的方式,让所有 TBtools 用户,都能完成 RNAseq 数据分析,从测序原始数据到基因表达量,使用的是一个曲线救国的策略,即直接使用 kallisto,跳过读段回帖,直接进行读段计数。
目前,更为常用的 RNAseq 上游数据分析流程,应该还是读段回帖之后进行读段计数。一般情况下,使用的软件是:star / hisat2。前者对内存要求高,而后者做了专门的层级索引设计,可以在个人电脑甚至是笔记本(比如我的笔记本 8G 内存)上完成绝大多数物种的转录组读段回帖。
于是,前几天对应的插件都开发出来了,即 hisat2-build 和 hisat2-align。走到这里,我们还能更进一步,做更有意义的事情。
早前的Kallisto本身是依赖于基因组基因结构注释的,其准确程度颇受已有注释的影响,而hisat2等基于回帖的,我们可以进一步做注释“自动校正”以及新转录本或基因挖掘。更为全面一些。这些,则往往常用的软件是 Stringtie。
Stringtie目前为止,并没有人编译windows版本(有点像 MCScanX 当初的情况),于是我做了尝试,调整了源码,并编译了(注:苹果用户 Mac 直接有可用程序,不存在这个问题)。折腾折腾,现在我们可以直接在 TBtools 里面进行转录组的有参考组装以及基于读段回帖的表达量估计。
于是,有必要整理一个教程,理清四个插件的使用,步骤如下:

  1. Hisat2-Build 建立索引
  2. Hisat2-Align 进行读段回帖
  3. Stringtie-Assembly 进行转录本组装
  4. Stringtie-Quantify 进行表达量估计

插件获取

插件直接从 TBtools 插件商店获取。主要到推荐从高速商店获取,参考前述推文《Plugin | 高速版插件商店!我又有一个绝妙的 idea》。

示例数据

Hisat2-Build 建立索引

设置基因组序列文件,用于建立索引



点击Start,并等待即可



可以看到输出目录会新的索引相关文件产生

如此,即完成了索引构建。

Hisat2-Align 进行读段回帖


总的来说,基本没什么特别要注意的,除非数据是链特异的,那么最好设置一下。另外是,是否很关注多匹配的reads,如repeat区域,那么可以考虑提高max hits。
恩,Threads 参数控制的是并行任务数目,而不是stringtie运行时的线程数。简单来说,假设输入的是 6 个样品,Threads设置为 2 ,那么同时会有最多两个样品在进行组装(即并行)。
输出结果会放置在输出目录下,



大体如下,



注意到,本文示例中只设置了一个样品,即reads。如果是多个样品,那么会分别输出4个类似文件。

Stringtie-Assembly 进行转录本组装


可能唯一需要注意的就是....并行任务数,可参考前述推文,其实常常也无需修改,一般按照电脑有多少个线程,保留2个,剩下的都可以用上试试。



示例数据只有一个样品,所以只组装出一个XXXX.assembly.gtf。无论有多少个输入样品,最终每个样品都会被独立组装,最后合并成一个 merged.stringtie.gtf。这个文件,可用于后续任何分析(亦即,完成了转录本组装)。

Stringtie-Quantify 进行表达量估计

Stringtie 除了进行组装,还可以估算转录本以及基因的表达量。



按照要求设置文件即可,可能需要调整的就是read length,如果你想要得到 read counts,用于下一步差异表达分析的话。
运行后,可以看到在输出目录增加了 6 个文件。



具体不详细展开。大伙应该知道是啥。

插件均已上传至高速商店,



感兴趣地同样参考前述推文《Plugin | 高速版插件商店!我又有一个绝妙的 idea》

写在最后

今天是大年初一 ~~~
新年新气象,
祝所有 TBtools 用户朋友,
牛年大吉!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,179评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,229评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,032评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,533评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,531评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,539评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,916评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,813评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,568评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,654评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,354评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,918评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,152评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,852评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,378评论 2 342

推荐阅读更多精彩内容