GO富集分析

前段时间,我们对显著差异转录本Pathway富集进行了解读,。今天,我们再来看看GO分析,以及相关图表的意义。

GO分析网站:http://pantherdb.org/,以及g:Profiler:https://biit.cs.ut.ee/gprofiler


预备知识1:转录本是什么?

转录组测序的研究对象是特定细胞在某一功能状态下所能转录出来的所有RNA的总和。转录组de novo测序是指在不需要物种基因组序列信息的情况下,用新一代高通量测序技术对某一物种特定组织或器官在某一状态下的转录本进行测序、组装得到转录本序列信息。基于组装出来的转录本,可进行差异GO分析。

预备知识2:基因表达与显著差异

在之前的《显著差异转录本Pathway富集》一文中,我们已经对显著差异基因做了简单介绍,提到了fold change和probability两个进行筛选差异基因的阀值。其中,probability是一个统计系数,而fold change(表达差异倍数)是怎么得来的呢?

要了解表达差异,首先要对基因的表达有一个初步的认识。在RNA-seq分析中,我们可以通过定位到基因区域的测序序列(reads)的数目来估计基因的表达水平。Reads数目除了与基因的真实表达水平成正比外,还与基因的长度和测序深度成正相关。为了使不同基因、不同实验间的基因表达水平具有可比性,我们使用FPKM(expected number of fragments per kilobase of tran sequence per millions base pairs sequenced,每百万测序碱基中每千个转录子测序碱基中所包含的测序片断数)对基因表达量进行标准化。根据FPKM值,我们才能对基因的表达进行定量化,从而根据不同样品或样品组的同一个基因的FPKM值求得差异倍数fold change并筛选出显著差异。

get了以上要点

我们来看看GO分析到底是怎么回事

GO分析概述

GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的、对基因和蛋白质功能进行限定和描述的、并能随着研究不断深入而更新的语言词汇标准。GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能。在转录组项目中,GO功能分析一方面给出差异表达转录本的GO功能分类注释;另一方面给出差异表达转录本的GO功能显著性富集分析。

GO分析结果详解

下面,我们来了解一下GO分析中的结果图表。

1

GO功能分类注释图

根据差异转录本注释到GO数据库的信息,可以绘制GO功能分类注释图,如图1左侧纵轴是GO功能的具体名称,右侧纵轴为功能的分类名称,横轴为释到对应GO功能的DEGs(差异转录本)数量。

图1. A-VS-B差异表达基因的GO分类图

2

转录本差异的GO显著富集表

与KEGG的显著富集相同,GO的显著富集也是从差异转录本中筛选的。首先,我们将差异表达转录本向GO数据库(http://www.geneontology.org/)的各term映射,并计算每个term的转录本数,从而得到具有某个GO功能的转录本列表及转录本数目统计。然后应用超几何检验,找出与整个转录本组背景相比,在差异表达转录本中显著富集的GO条目,该假设检验的p-value计算公式为:

其中,N为所有转录本中具有GO注释的转录本数目;n为N中差异表达转录本的数目;M为所有转录本中注释为某特定GO term的转录本数目;m为注释为某特定GO term的差异表达转录本数目。计算得到的pvalue通过Bonferroni校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的GO term定义为在差异表达转录本中显著富集的GO term。

GO功能分析同时整合了表达模式聚类分析,研究人员能方便地看到具有某一功能的所有差异转录本的表达模式。如表1establishment of localization为在A_vs_B差异表达转录本中最显著富集的一个GO term。

表1. A_vs_B_P GO显著性富集分析列表

3

GO term信息查阅

点开表1的第一个GO term名称可进入GO数据库的网站,在该网站搜索GO term名称将会显示对应GO term的详细信息,搜索表1中的establishment of localization 即可查看到如图2中的信息。

图2. A-vs-B差异GO term:establishment of localization在GO数据库中的详细信息

4

转录本差异的GO显著富集图

在得到表1中的GO显著富集后,我们根据此表绘制更直观的GO富集散点图,如图3。其中RichFactor指差异表达的转录本中位于该GO条目的转录本数目与所有有注释转录本中位于该GO条目的转录本总数的比值,RichFactor越大,表示富集的程度越大。Qvalue是做过多重假设检验校正之后的Pvalue,取值范围为0到1,越接近于零,表示富集越显著。图右侧信息依次为RichFactor值,Pvalue值以及该点对应的GO term名称。

图3. GO富集散点图


BgRatio是目标通路基因占通路集总基因比例,假设公式为 M/N

M - 目标通路基因总数(去重后)

N- 通路集总基因数(去重后),如目前KEGG通路人种为7884个基因

GeneRatio是你的基因列表富集到目的通路基因数占基因列表包含基因集总基因比例,假设公式为 k/n

k - 基因列表包含某通路基因数目

n - 基因列表包含通路集基因总数,假设基因列表为向量 A 通路集基因为 B,那么这是2者交集基因数。length(intersect(A, B))

richFactor是富集到目标通路基因数占比, richFactor = k/M

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,271评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,725评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,252评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,634评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,549评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,985评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,471评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,128评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,257评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,233评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,235评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,940评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,528评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,623评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,858评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,245评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,790评论 2 339

推荐阅读更多精彩内容