2.基于小鼠的基因集数据库资源

1 问题的提出

超几何分布检验和GSEA的差异
通常拿到了上下调差异基因列表,然后说的GO/KEGG数据库注释,指的是超几何分布检验。

但是如果我们并不是首先自定义阈值,确定上下调差异基因列表,而是根据某个指标(比如logFC)把全部的基因排序,再去进行GO/KEGG数据库注释,一般来说就是GSEA分析啦。

但是数据库不仅仅是GO/KEGG哦
MSigDB(Molecular Signatures Database)数据库中定义了已知的基因集合:http://software.broadinstitute.org/gsea/msigdb 包括H和C1-C7八个系列(Collection),每个系列分别是:

H: hallmark gene sets (癌症)特征基因集合,共50组,最常用;
C1: positional gene sets 位置基因集合,根据染色体位置,共326个,用的很少;
C2: curated gene sets:(专家)校验基因集合,基于通路、文献等:
C3: motif gene sets:模式基因集合,主要包括microRNA和转录因子靶基因两部分
C4: computational gene sets:计算基因集合,通过挖掘癌症相关芯片数据定义的基因集合;
C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)
C6: oncogenic signatures:癌症特征基因集合,大部分来源于NCBI GEO 发表芯片数据
C7: immunologic signatures: 免疫相关基因集合。
可以看到,GO/KEGG是最出名的,但不是唯一的!
但是对于人和鼠的基因来说,人的基因多数是大写字母表示,而鼠是同源基因多数是首字母大写,其余字母小写。但仅仅首字母大写并不能完全实现人鼠基因转换。可以找到一一对应的基因列表,进行转换。因此本文使用其他方法进行人鼠基因的转换

希望得到:

全部的50个基因集差异情况
下面的表格里面的表头分别是:

人基因集的基因数量
小鼠基因集的基因数量
两个基因集overlap数量
人特有的基因数量
小鼠特有的基因数量:

2 答案

使用msgdb数据库提取hallmarker通路基因集,就可以解决了

rm(list=ls())
library(stringr)
library(msigdbr)
library(dplyr)
library(purrr)
hallmark.mouse=msigdbr(species = "Mus musculus",category = "H") #提取基因信息
hallmark.human=msigdbr(species = "Homo sapiens",category = "H")
v1=hallmark.human%>%group_by(gs_name)%>%summarise(v1=n())
v2=hallmark.mouse%>%group_by(gs_name)%>%summarise(v2=n())
v3=hallmark.human%>%filter(hallmark.human$human_gene_symbol%in%str_to_upper(hallmark.mouse$gene_symbol))%>%group_by(gs_name)%>%summarise(v3=n())
v4=hallmark.human%>%filter(!str_to_title(hallmark.human$human_gene_symbol)%in%hallmark.mouse$gene_symbol)%>%group_by(gs_name)%>%summarise(v4=n())
v5=hallmark.mouse%>%filter(!str_to_upper(hallmark.mouse$gene_symbol)%in%hallmark.human$gene_symbol)%>%group_by(gs_name)%>%summarise(v5=n())
res=reduce(list(v1,v2,v3,v4,v5),.f=full_join,by="gs_name") #reduce批量整合
res=data.frame(res)
res[is.na(res)]<-0 #转换NA为0
res

网友(董理聪)投稿
应曾老师的邀请,这里发邮件说说生成全排列的算法。也只是基本算法的实现而已。

递归函数
如果一个函数在内部调用自身,就是递归函数。

通常来说,一门程序语言的教程在讲到函数的时候,也都会提及到 迭代 与 递归。

最经典的使用递归函数的例子是生成 Fibonacci 数列。

def Fibonacci(n):
  if n == 0:
    return 0

  if n in [1, 2]:
    return 1

  return Fibonacci(n - 1) + Fibonacci(n - 2)

于是生成全排列的方法也可以使用递归函数。

def permutations(iterable):
  if len(iterable) == 1:
    yield iterable

    # 每次抽出一个元素,其他元素再产生全排列
    for i, element in enumerate(iterable):
    for p in permutations(iterable[:i] + iterable[i + 1:]):
      yield [element, ] + p

permutations(list(range(1, 9)))

这个网友强推python ,一直在使用 Jupyter Notebook;希望我们以后的教程,比如 rm(ls = ls()) 的代码没有必要放在推文里;

参考了学徒的答案:将每次递归的结果保存下来可以使用函数传递参数的方法实现。

perm_wapper=function(strLst){
  result<-list()
  idx<-1
  perm=function(x,temp=c()){
    if (length(x)==1) {
      result[[idx]]<-c(temp,x)
      idx<-idx+1
    }else{
      for (i in x){
        ind=which(i==x)
        perm(x[-ind],c(temp,i))
      }
    }
  }
  perm(strLst)
  return(result)
}
res=perm_wapper(c("a","b","c"))
[[1]]
[1] "a" "b" "c"

[[2]]
[1] "a" "c" "b"

[[3]]
[1] "b" "a" "c"

[[4]]
[1] "b" "c" "a"

[[5]]
[1] "c" "a" "b"

[[6]]
[1] "c" "b" "a"
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容