2023-02-08对候选基因(GWAS\转录组)进行GO注释(气泡图和柱形图)

目前网上的教程大多是模式植物,或者是非模式物种的重新构建的教程。
今天分享一个新的方法,对非模式植物研究中获得的基因(例如:GWAS、转录组差异基因等)进行转录因子富集分析气泡图和柱状图可视化。
教程如下:

利用plantTFDB对转录因子进行预测

1、准备差异基因序列

提取差异基因序列
faSomeRecords ../Trinity.gene.fasta DEG_ID_FC1.5FDR0.05.txt leaf_vs_fruit_FC1.5FDR0.05.fasta
faSomeRecords ../Trinity.gene.fasta DEG_ID_FC1.5FDR0.05.txt stem_vs_fruit_FC1.5FDR0.05.fasta
faSomeRecords ../Trinity.gene.fasta DEG_ID_FC1.5FDR0.05.txt stem_vs_leaf_FC1.5FDR0.05.fasta
http://plantregmap.gao-lab.org/index.php

2、打开PlantTFDB(5.0)

数据库链接如下:http://plantregmap.gao-lab.org/index.php
点击导航栏的Prediction按钮,即可打开预测页面。

图片.png

3、TF预测

然后输入你的基因序列,比如差异基因序列,即可开始在线分析:


图片.png

获得TF_and_best1_in_Ath.list文件


图片.png

注意:在这一步点击下载选项不会直接下载文件,而是弹出结果页面。可以用wget命令通过服务器进行下载
图片.png

这个分析的作用就是:判断你的哪些(差异)基因可能是转录因子。

4、go分析预测

将TF_and_best1_in_Ath.list中的第三列粘贴到框内

图片.png

图片.png

开始submit运行
对结果进行下载


图片.png

5、转录因子富集分析

图片.png

富集分析的原理

网上已有很多人介绍其原理,我们平时最常用的富集分析方法就是Over-Represence Analysis(ORA),本质上是一次不放回抽样的概率事件。在这里首推CJ大神写的推文:GO富集分析 从原理到实践 ~ 零基础掌握。大家可以自行阅读,熟悉一下富集分析的原理。

转录因子的富集分析

当你了解了富集分析背后的原理后,你就能明白:所谓转录因子富集分析,就是以全基因组各个家族的转录因子为背景,通过比较给定的基因中各个家族的转录因子的数量及比例来计算其显著性。为了达到这一目的,我们需要做的无非是三件事:

  • 准备包含待研究物种的基因组内所有转录因子的文件;
  • 准备个记录转录因子基因ID和家族的对应关系的文件;
  • 准备待分析的转录因子的基因ID列表;
    当然,我们还需要准备富集分析用到的软件,并根据软件要求将数据调整成恰当的格式。该富集分析需要用的软件包是Y叔开发的clusterProfile包,所以针对该包对数据的要求,上述提高的三个数据文件应遵循如下形式:

TF id和物种内所有转录因子基因ID的对应关系,其中TFid是人为规定的(TF2gene);


图片.png

TF id和转录因子家族的对应关系(TF2term);


图片.png

待分析的基因ID,比如某一时期处理A和对照B的所有差异基因ID (genelist)
图片.png

整理文件如上述格式

输入文件:PlantTFDB网站对全基因组蛋白序列的鉴定结果

文件名:TF_and_best1_in_Ath.list(还是上面的那个转录因子预测文件)

文件内容如下:


图片.png
library(tidyverse)
# 1.读取数据
df <- read_tsv('TF_and_best1_in_Ath.list', comment = '#', col_names = F)
# 只保留前两列
df <- select(df, X1:X2)

然后是获得TF id和转录因子家族的对应关系

TF2term <- df
TF2term <- df %>% 
  select(term = X2) %>%
  mutate(TF = paste('TF', 1:nrow(TF2term), sep = '_')) %>%
  select(TF, term)

以该文件为基础,给所有转录因子的基因ID分配TF id

TF2gene <- df %>% 
  left_join(TF2term, by = c('X2' = 'term')) %>%
  select(TF, gene = X1)

富集分析

library(clusterProfiler)
options(stringsAsFactors = F)
genelist <- read.table('genelist.txt')$V1

TFenrich <- enricher(gene = genelist,
                     TERM2GENE = TF2gene, 
                     TERM2NAME = TF2term,
                     pvalueCutoff = 1,
                     qvalueCutoff = 1,
                     pAdjustMethod = 'BH')
# plot
dotplot(TFenrich, showCategory = 20)
图片.png

另外,你可以把富集结果转换成数据框输出或进一步绘图

TF_datafram <- as.data.frame(TFenrich)
write.table(TF_datafram, 'TF_enrich.result', sep = '\t', row.names = F, quota =F)

6、GO富集柱形图绘制

下载go_enrichment_full_all.txt文件


图片.png

图片.png

将go_enrichment_full_all.txt中的GO.ID、Annotated(Description)、Count(GeneNumber)和Aspect(type)四列手动提取出来,得到文件leaf_vs_fruit.csv


图片.png

绘图

data=read.csv("leaf_vs_fruit.csv",header=T,stringsAsFactors = F)
1.按照qvalue升序排序,分别选出前20个BP,CC,MF的条目,由于enrichGO函数生成的数据框默认是按照qvalue升序排序,所以这里我们只用选取前二十个就行了
go_MF<-data[data$type=="molecular function",][1:20,]
go_CC<-data[data$type=="cellular component",][1:20,]
go_BP<-data[data$type=="biological process",][1:20,]
go_enrich_df<-data.frame(ID=c(go_BP$ID, go_CC$ID, go_MF$ID),
                         Description=c(go_BP$Description, go_CC$Description, go_MF$Description),
                         GeneNumber=c(go_BP$GeneNumber, go_CC$GeneNumber, go_MF$GeneNumber),
                         type=factor(c(rep("biological process", 20), rep("cellular component", 20),rep("molecular function",20)),levels=c("molecular function", "cellular component", "biological process")))
2.将GO_term设定为factor即可按照顺序输出
GO_term_order=factor(as.integer(rownames(go_enrich_df)),labels=go_enrich_df$Description)
library(ggplot2)
ggplot(data=go_enrich_df, aes(x=GO_term_order,y=GeneNumber, fill=type)) + geom_bar(stat="identity", width=0.8) + coord_flip() +  xlab("GO term") + ylab("Num of Genes") + theme_bw() + theme_classic() + theme(panel.border = element_rect(colour = "black", fill=NA, size=1))

图片.png

参考
https://cloud.tencent.com/developer/article/1674672
https://mp.weixin.qq.com/s?__biz=Mzg5NDI0MDY0MA==&mid=2247494078&idx=1&sn=de2726a2554f7a77d6c689c28487e74d&chksm=c0203b51f757b2479e405c11b0cf5f93c10ab0759b867225406fb9dbf3ca732ca70f122f3b2f&mpshare=1&scene=1&srcid=0207YYqURmqQ0dOOxXE5PdcG&sharer_sharetime=1675733976691&sharer_shareid=131ce7013fe8cdac25e7cf500f2974d5&key=f4efb34f476d52d4e8e512ffce99e5285991d2700cc5232881e6a8f839c696e09488743c6d868614b7e6a490f93ddcb324821080b92075048667c7365b437703cf014889c5b17e5759d01ae2b1c0be8726907715c52a173310518dd8c65b19f9fe353ecfe64725be39c7a096ea43825ca0f69651ab7b4fdb44e3e7e80a34f54b&ascene=0&uin=MTc0MzUxMTczNQ%3D%3D&devicetype=Windows+10+x64&version=63090016&lang=zh_CN&exportkey=n_ChQIAhIQpr2JCT5bNGJr7Bh6JV4prxLgAQIE97dBBAEAAAAAAEGCDV0r%2BV8AAAAOpnltbLcz9gKNyK89dVj0qZAUrMe2LumFhOcDzy4pnUwAz3E%2BUnsQhlQKN4rlTmttVBEC12lY6wXgXBPxru6X22om%2BXCWNHNIU74erREKtOj70dtbDcRUT3TuxB4qD%2BHXfU63HuCINvXgQPQ8Xb%2FgjTJJLt3fHSTN%2BETSuP0%2F9oox1rJMb5BGMWV7pluhb6e6Ag%2F9hOJ0r3EVHLscvWOUVILbpx%2BcsUo51MK96Rjn5kI8hsmPoaVHBKUmAYsDdCwhcz%2FgI1eWE%2F%2FM&acctmode=0&pass_ticket=H5ZRnEVEy4hpgjMhkD4REt1GUwyi3%2BvGHPhe%2FgElV9PRtGDoxLJz%2FK8wJfOovLfUM4BL3cRCExrsES%2F%2Bh6%2F%2FXA%3D%3D&wx_header=1&fontgear=2
https://www.cnblogs.com/yanjiamin/p/12122215.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,230评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,261评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,089评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,542评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,542评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,544评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,922评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,578评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,816评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,576评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,658评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,359评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,920评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,859评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,381评论 2 342

推荐阅读更多精彩内容