前面小编给大家整理汇总了目前生信交流平台上发布过的所有与GO和KEGG富集分析相关的微信文章。
今天我们继续来聊功能富集分析,KO富集分析。KO是KEGG ontology的缩写。KO数据库(https://www.genome.jp/kegg/ko.html)中的每一条记录用一个唯一的KO号进行标识。例如ko05200代表的是pathway in cancerhttps://www.genome.jp/pathway/ko05200
看上去是不是跟人的pathway in cancer很相似,KO通路里面的每一个节点用一个唯一的K开头的ID号来标识,表示一个蛋白。
KO数据库基于同源基因具有相似功能的假设,把基因的功能进行了扩充。对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology, 用该基因的功能作为该orthology 的功能。这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库。
那么如果我们手上有一个K开头ID的列表,怎么对其进行富集分析,找到显著富集的通路呢?其实还是很简单的,还是用前面KEGG富集分析用到的clusterProfiler包进行分析
library("clusterProfiler")
# 导入KOID
KO_list=read.csv("KO_list.csv")[[1]]
#进行富集分析
result1=enrichKEGG(KO_list,
organism = "ko", #物种选择ko
pvalueCutoff = 0.05, #p值cutoff
pAdjustMethod = "BH", #FDR矫正p值
qvalueCutoff = 0.2 #q值cutoff
)
#保存富集分析结果
write.csv(file="KO_enrichment_result1.csv",data.frame(result1),row.names=F)
# 绘制条形图
barplot(result1)
# 绘制气泡图
dotplot(result1)
富集分析结果表
富集分析柱形图
富集分析气泡图