接下来是对WGCNA分析的yellow模块和turquoise模块里的基因分别做GO和KEGG富集分析;
文章中是用R包clusterprofiler做的: 分别对最相关的yellow模块和最负相关的turquoise模块做GO和KEGG富集分析;
代码:
一、分别对yellow模块和turquoise模块基因做GO富集分析
rm(list = ls())
options(stringsAsFactors = F)
library(clusterProfiler)
library(org.Hs.eg.db)
#yellow模块
yellow_hub_gene = read.csv('yellow_hub_gene.csv',header = F)
colnames(yellow_hub_gene) <- 'name'
yellow_hub_gene=yellow_hub_gene[-1,]
gene=unique(yellow_hub_gene)
##基因转ID
sig_DP_entrezId = mapIds(x = org.Hs.eg.db,
keys = unique(gene),
keytype = "SYMBOL",
column = "ENTREZID")
table(is.na(sig_DP_entrezId))
sig_DP_entrezId <- na.omit(sig_DP_entrezId)
go_bp <- enrichGO(gene = sig_DP_entrezId,
OrgDb = org.Hs.eg.db,
keyType = "ENTREZID",
ont = "BP",
pvalueCutoff = 0.5,
qvalueCutoff = 0.5,
readable = TRUE)
#画图
barplot(go_bp)
我们的yellow模块与文章中的green模块基因富集到相似的BP途径:细胞周期以及核分裂等BP途径;
#turquoise模块
turquoise_hub_gene = read.csv('turquoise_hub_gene.csv',header = F)
colnames(turquoise_hub_gene) <- 'name'
turquoise_hub_gene=turquoise_hub_gene[-1,]
gene=unique(turquoise_hub_gene)
##基因转ID
sig_DP_entrezId = mapIds(x = org.Hs.eg.db,
keys = unique(gene),
keytype = "SYMBOL",
column = "ENTREZID")
table(is.na(sig_DP_entrezId))
sig_DP_entrezId <- na.omit(sig_DP_entrezId)
go_bp <- enrichGO(gene = sig_DP_entrezId,
OrgDb = org.Hs.eg.db,
keyType = "ENTREZID",
ont = "BP",
pvalueCutoff = 0.5,
qvalueCutoff = 0.5,
readable = TRUE)
#画图
barplot(go_bp)
二、KEGG富集分析
- 富集分析既可以用上面的R包进行分析,也可以用在线工具分析,比如DAVID、METASCAPE等;
- 在平时分析的时候我们也可以用多个方法分析来相互验证自己的结果;
关于DAVID网站我前面记录了使用方法,有没用过这个网站的朋友可以参考一下:
1. yellow模块结果
KEGG结果与文章基本一致;
1. turquoise模块结果
大家也可以参考我上面发的链接里面的文章,通过DAVID里面的结果画气泡图,感兴趣的朋友可以试一下。
小结:
通过对最正相关的yellow模块和最负相关的turquoise模块里面的基因进行富集分析,发现这些基因主要富集在一些与癌症发生发展相关的通路。
往期文章复现: