基于GO-Figure快速绘制GO富集气泡图

GO-Figure! 是一个基于pyhton写的GO富集小软件，方便我们拿到富集结果后直接使用命令行的形式进行可视化，绘制出具有灵活性、可重复性的图形，且可基于最新的GO数据库内容进行富集。效果图如下，若用惯了常见的气泡柱形图，这种形式也不失为一种新颖的可视化方法~

image-20221124194112907

pip安装packages

首先要确保使用的python3以上

##安装软件
git clone https://gitlab.com/evogenlab/GO-Figure.git
##下载以下几个packages
pip install numpy 
pip install matplotlib
pip install seaborn
pip install scikit-learn 
pip install adjustText
##检测是否成功使用
 python3 gofigure.py -h

image-20221124190410468

重要参数

-rs/--random_seed：相当于随机种子，图形label有重叠时候可以替换，默认1

-i/-o: 输入、输出

-a,--max_clusters: 要绘制的最大term数量(整数值)。默认= 50。

-j: 输入文件的类型

-n, --ontology: 使用哪个本体:生物过程('bpo')、分子功能('mfo')、细胞成分('cco')，还是所有本体('all')。默认就是all。

-si, --similarity_cutoff：GO terms相似性阈值介于0到1之间. Default = 0.5.

-r, --representatives: 具有作为代表的优先级的GO terms。逗号分割，如 'GO:0000001,GO:0000002

-v, --max_pvalue: 最大的p value

-so, --sort_by: 基于哪列的值进行排序

nc, --name_changes：更改名字

.......(还有挺多有用参数，自行了解)

输入数据类型

具有以下4种类型

1. Standard input

标准的输入数据只含有两列信息：GO term 和富集的Pvalue

image-20221124190616711

2. Standard-plus input

我们也可以增添一列显著term中包含的gene数量

image-20221124190732497

3. TopGO input

使用TopGO富集结果，带上行号共有以下7列数据

image-20221124190819508

4. GOStats input

使用GOStats包的输出结果，包含以下7列信息，开头的几行信息可以删除。

image-20221124191059025

绘图

这里我们拿自带的standard-plus_example_input.tsv文件举例进行分析

基础图形

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -o result 
##

image-20221124192301943

这里可以通过-si 参数设置阈值 , -v 设置显著性阈值

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -si 0.8 -v 0.00001

image-20221124192726103

改变色彩

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -p viridis -o result

image-20221124192857358

添加标签及箭头

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -u go-arrows -o result

image-20221124192948646

更多参数及使用例子详见文档Waterhouse Lab / GO-Figure · GitLab学习。

注：更新GO-Figure！

开头的地方提到了可基于最新的GO数据库内容进行富集，就是因为该软件进行分析基于的数据主要来自于以下两个文件:

go.obo (http://geneontology.org/docs/download-ontology/)
goa_uniprot_all.gaf.gz (https://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/) 解压后100G~左右

这两个文件是持续更新的，因此我们使用前下载这两个最新的文件，就可以富集到更加可靠的结果。

下载完毕后，我们还需要使用软件自带的脚本对这两个文件进行解析:

python3 scripts/relations.py data/go.obo > data/relations.tsv
python3 scripts/ics.py data/relations.tab goa_uniprot_all.gaf data/go.obo > data/ic.tab

至此，拿到relations.tsv和ic.tab两个文件后，我们就可以使用上述的命令行进行富集分析了~自己体验下吧！

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,230评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,261评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,089评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,542评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,542评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,544评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,922评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,578评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,816评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,576评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,658评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,359评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,937评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,920评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,859评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,381评论 2赞 342