Q&A | 如何使用clusterProfiler对MSigDB数据库进行富集分析

MSigDB_cluster.jpg

Q&A | 如何使用clusterProfiler对MSigDB数据库进行富集分析

[TOC]

Question

有朋友在后台提问:在使用clusterProfiler做富集分析时,想用MSigDB里的数据库进行注释,而不是常规的GOKEGG,需要怎么操作。其实这个问题在clusterProfiler包的使用文档(Chapter 12 Universal enrichment analysis | Biomedical Knowledge Mining using GOSemSim and clusterProfiler (yulab-smu.top)里已经写的很清楚了,这里我就简单的翻译一下。

22

MSigDB

The Molecular Signatures Database (MSigDB) 一个用于GSEA软件的注释基因集的集合。MSigDB基因集分为9个主要集合:

该基因集概括和代表了特定的定义良好的生物状态或过程,并显示一致的表达。这些基因集是通过一种计算方法生成的,该方法基于识别其他MSigDB集合中基因集之间的重叠,并保留显示协调表达的基因。

image-20211128211938966

该类别包含人类每条染色体上的不同cytoband区域对应的基因集合。根据不同染色体编号进行二级分类。

image-20211128213020942

共识基因集合,基于通路、文献等:这部分包括我们熟悉的KEGG信号通路等 。

image-20211128213310663

该类别包含了miRNA靶基因和转录因子结合区域等基因集合。

image-20211128213511704

该类别包含计算机软件预测出来的基因集合,主要是和癌症相关的基因,示意如下

image-20211128213642281

C5基因集分为两个子集,第一个来自于包含BP、CC和MF的Gene Ontology(GO),第二个来自于人类表型本体(HPO)。

image-20211128214417982

代表细胞通路的基因集合,这些通路在癌症中通常是不受调节的。大多数特征直接来自NCBI GEO的微阵列数据,或者来自内部未发表的涉及已知癌症基因微扰的分析实验。

image-20211128214611062

该类别包含了免疫系统功能相关的基因集合。

image-20211128214756599

包含人类组织单细胞测序研究中确定的细胞类型的簇标记的基因集。

image-20211128215001610

富集分析

你可以从 Broad Institute 下载 GMT files 然后使用 read.gmt() 读取文件并作为enricher() and GSEA()的参数。

当然。也有一个R包msigdbr,已经将MSigDB基因集打包成整齐的数据格式,可以直接与clusterProfiler一起使用。

我们使用 C6, oncogenic gene sets 为例。

# BiocManager::install("msigdbr")
library(msigdbr)
# 提取C6库
m_t2g <- msigdbr(species = "Homo sapiens", category = "C6") %>% 
  dplyr::select(gs_name, entrez_gene)
head(m_t2g)
> head(m_t2g)
# A tibble: 6 x 2
  gs_name      entrez_gene
  <chr>              <int>
1 AKT_UP.V1_DN       57007
2 AKT_UP.V1_DN       22859
3 AKT_UP.V1_DN       22859
4 AKT_UP.V1_DN      137872
5 AKT_UP.V1_DN         249
6 AKT_UP.V1_DN         271

富集分析

# 导入示例基因
data(geneList, package="DOSE")
head(geneList)
gene <- names(geneList)[abs(geneList) > 2]
head(gene)
em <- enricher(gene, TERM2GENE=m_t2g)
head(em)
> head(em)
                                           ID            Description
RPS14_DN.V1_DN                 RPS14_DN.V1_DN         RPS14_DN.V1_DN
GCNP_SHH_UP_LATE.V1_UP GCNP_SHH_UP_LATE.V1_UP GCNP_SHH_UP_LATE.V1_UP
PRC2_EZH2_UP.V1_DN         PRC2_EZH2_UP.V1_DN     PRC2_EZH2_UP.V1_DN
VEGF_A_UP.V1_DN               VEGF_A_UP.V1_DN        VEGF_A_UP.V1_DN
RB_P107_DN.V1_UP             RB_P107_DN.V1_UP       RB_P107_DN.V1_UP
E2F1_UP.V1_UP                   E2F1_UP.V1_UP          E2F1_UP.V1_UP
                       GeneRatio   BgRatio       pvalue     p.adjust
RPS14_DN.V1_DN            22/183 186/10915 4.716365e-13 7.970657e-11
GCNP_SHH_UP_LATE.V1_UP    16/183 181/10915 5.815455e-08 4.914059e-06
PRC2_EZH2_UP.V1_DN        15/183 192/10915 7.635020e-07 3.446929e-05
VEGF_A_UP.V1_DN           15/183 193/10915 8.158412e-07 3.446929e-05
RB_P107_DN.V1_UP          10/183 130/10915 6.428560e-05 2.024672e-03
E2F1_UP.V1_UP             12/183 188/10915 7.522623e-05 2.024672e-03
                             qvalue
RPS14_DN.V1_DN         6.503619e-11
GCNP_SHH_UP_LATE.V1_UP 4.009603e-06
PRC2_EZH2_UP.V1_DN     2.812505e-05
VEGF_A_UP.V1_DN        2.812505e-05
RB_P107_DN.V1_UP       1.652021e-03
E2F1_UP.V1_UP          1.652021e-03
                                                                                                                                       geneID
RPS14_DN.V1_DN         10874/55388/991/9493/1062/4605/9133/23397/79733/9787/55872/83461/54821/51659/9319/9055/10112/4174/5105/2532/7021/79901
GCNP_SHH_UP_LATE.V1_UP                                      55388/7153/79733/6241/9787/51203/983/9212/1111/9319/9055/3833/6790/4174/3169/1580
PRC2_EZH2_UP.V1_DN                                          8318/55388/4605/23397/9787/55355/10460/6362/81620/2146/7272/9212/11182/3887/24137
VEGF_A_UP.V1_DN                                                   8318/9493/1062/9133/10403/6241/9787/4085/332/3832/7272/891/23362/2167/10234
RB_P107_DN.V1_UP                                                                         8318/23397/79733/6241/4085/8208/9055/24137/4174/1307
E2F1_UP.V1_UP                                                                  55388/7153/23397/79733/9787/2146/2842/9212/8208/1111/9055/3833
                       Count
RPS14_DN.V1_DN            22
GCNP_SHH_UP_LATE.V1_UP    16
PRC2_EZH2_UP.V1_DN        15
VEGF_A_UP.V1_DN           15
RB_P107_DN.V1_UP          10
E2F1_UP.V1_UP             12
dotplot(em)
image-20211128220536033

思考

之前R 实战 | 使用clusterProfiler进行多组基因富集分析我们讲过如何使用clusterProfiler进行多组基因富集分析,但是compareClusterfun参数只有groupGO, enrichGO, enrichKEGG, enrichMKEGG, enrichWP ,enricher ,enrichPathway, enrichDO, enrichNCG, enrichDGN , enrichMeSH.如何使用compareClusterMSigDB数据库进行多组富集分析呢?大家可以思考一下。

参考

📖 Introduction | Biomedical Knowledge Mining using GOSemSim and clusterProfiler (yulab-smu.top)

往期

  1. 跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图
  2. (免费教程+代码领取)|跟着Cell学作图系列合集
  3. 跟着Nat Commun学作图 | 1.批量箱线图+散点+差异分析
  4. 跟着Nat Commun学作图 | 2.时间线图
  5. 跟着Nat Commun学作图 | 3.物种丰度堆积柱状图
  6. 跟着Nat Commun学作图 | 4.配对箱线图+差异分析

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容