TCGA 拷贝数变异（CNV）–使用maftools读取和汇总gistic输出文件（三）

读取和汇总gistic输出文件

maftools : Summarize, Analyze and Visualize MAF Files

rm(list = ls())
library(tidyverse)
# 建议下载github最新版本的maftools包
library(maftools)

#读入GISTIC输出的文件
laml.gistic = readGistic(gisticAllLesionsFile = './Gistic 2.0 results/all_lesions.conf_99.txt',
                         gisticAmpGenesFile = './Gistic 2.0 results/amp_genes.conf_99.txt', 
                         gisticDelGenesFile = './Gistic 2.0 results/del_genes.conf_99.txt', 
                         gisticScoresFile = './Gistic 2.0 results/scores.gistic', 
                         isTCGA = T)

## -Processing Gistic files..
## --Processing amp_genes.conf_99.txt
## --Processing del_genes.conf_99.txt
## --Processing scores.gistic
## --Summarizing by samples

laml.gistic

## An object of class  GISTIC 
##           ID summary
## 1:   Samples     500
## 2:    nGenes    8606
## 3: cytoBands      37
## 4:       Amp      39
## 5:       Del   59539
## 6:     total   59578

可视化重要的结果

##绘图
#genome plot 部分突出了明显的扩增和删失区域
gisticChromPlot(gistic = laml.gistic, ref.build = 'hg38') ## 参考基因组选hg38

image.png

#Bubble plot 绘制显著改变的cytobands,以及改变的样本数和它所包含的基因数的函数。每一个气泡的大小是根据-log10转化q值。
gisticBubblePlot(gistic = laml.gistic)

image.png

#oncoplot  
gisticOncoPlot(gistic = laml.gistic, 
               sortByAnnotation = TRUE, top =20)

image.png

挑选q<0.25的基因

(sig_cytoband <- laml.gistic@cytoband.summary %>% filter(qvalues<0.25) %>% .$Unique_Name)

##  [1] "DP_13:8q24.22"  "DP_17:10q23.1"  "DP_33:22q12.3"  "DP_16:10q21.2" 
##  [5] "DP_11:8p23.2"   "AP_1:4q31.21"   "AP_3:22q11.21"  "DP_18:10q23.31"
##  [9] "DP_25:16q23.2"  "DP_27:17p13.3"  "DP_34:22q13.32" "DP_3:2q37.1"   
## [13] "DP_31:20p12.1"  "DP_26:16q23.3"  "DP_10:7q34"     "DP_12:8q24.11" 
## [17] "DP_14:9q22.32"  "DP_15:10q11.21" "DP_19:12p13.2"  "DP_1:2p23.1"   
## [21] "DP_20:13q14.11" "DP_21:13q22.1"  "DP_22:14q24.2"  "DP_24:16p13.2" 
## [25] "DP_28:18q21.33" "DP_29:19p13.3"  "DP_2:2p11.2"    "DP_30:19p13.12"
## [29] "DP_32:22q12.3"  "DP_4:3p25.3"    "DP_6:5p14.1"    "DP_9:7q22.3"   
## [33] "DP_23:15q25.3"  "DP_8:6q27"      "DP_5:4q31.21"   "AP_2:7q34"     
## [37] "DP_7:6q26"

table(grepl(pattern = "AP",sig_cytoband))

## 
## FALSE  TRUE 
##    34     3

## 挑选q值小于0.25的Amplification cytoband
sig_AP_cytoband <- laml.gistic@cytoband.summary %>% 
  filter(qvalues<0.25) %>% 
  .$Unique_Name %>% 
  .[grepl(pattern = "AP",.)]

length(sig_AP_cytoband)

## [1] 3

## 将Amplification 的基因挑选出来
sig_AP_gene <- laml.gistic@data %>% filter(Cytoband %in% sig_AP_cytoband) %>% .$Hugo_Symbol 
unique(sig_AP_gene)

## [1] "CECR2"        "LOC105377458" "[MTRNR2L6]"

## 挑选q值小于0.15的Deletion cytoband
sig_DP_cytoband <- laml.gistic@cytoband.summary %>% 
  filter(qvalues<0.15) %>% 
  .$Unique_Name %>% 
  .[grepl(pattern = "DP",.)]

length(sig_DP_cytoband)

## [1] 10

## 将Deletion cytoband 的基因挑选出来
sig_DP_gene <- laml.gistic@data %>% filter(Cytoband %in% sig_DP_cytoband) %>% .$Hugo_Symbol 
head(unique(sig_DP_gene))

## [1] "APOL1"   "APOL2"   "APOL4"   "APOL3"   "MIR6819" "FAM19A5"

挑一个基因出来看看

## 看一下经典的抑癌基因在那个Cytoband
"CECR2"%in% sig_AP_gene

## [1] TRUE

laml.gistic@data %>% 
  filter(Hugo_Symbol %in% "CECR2") %>% 
  .$Cytoband %>% 
  unique(.)

## [1] "AP_3:22q11.21"

## 一层一层的剥桔子，让我找到你了，然后再返回去看看Amplification GISTIC plot。真香，对上了。单基因的分析就结束了。

找到了基因之后就可以“为所欲为了….”

# 拷贝数缺失区域的基因那么多，来个GO、kegg、GSEA这些分析是不是来一套了。我就简单copy下代码做做GO分析
# 用Y叔的包玩玩
length(unique(sig_DP_gene))## 因为选择q<0.25的拷贝数区域缺失的基因个数太多了(8000多)，所以我修改了下q值，按需修改，没有好的阈值，只有合不合适的结果。

## [1] 842

library(clusterProfiler)
library(org.Hs.eg.db)
library(topGO)
sig_DP_entrezId = mapIds(x = org.Hs.eg.db,
                       keys = unique(sig_DP_gene),
                       keytype = "SYMBOL",
                       column = "ENTREZID")

table(is.na(sig_DP_entrezId))

## 
## FALSE  TRUE 
##   791    51

sig_DP_entrezId <- na.omit(sig_DP_entrezId)

go_ALL <- enrichGO(gene = sig_DP_entrezId,
                       OrgDb = org.Hs.eg.db,
                       keyType = "ENTREZID",
                       ont = "ALL",
                       pvalueCutoff = 0.5,
                       qvalueCutoff = 0.5)

##分析完成后，作图
dotplot(go_ALL, split="ONTOLOGY")+ facet_grid(ONTOLOGY~.,scale="free")

image.png

### 数目太多，我只要各个条目的前6个

BP_df<- go_ALL@result %>% arrange(desc(Count)) %>% filter(ONTOLOGY=="BP") %>% head()
CC_df<- go_ALL@result %>% arrange(desc(Count)) %>% filter(ONTOLOGY=="CC") %>% head()
MF_df<- go_ALL@result %>% arrange(desc(Count)) %>% filter(ONTOLOGY=="MF") %>% head()
go_df <- rbind(BP_df,CC_df,MF_df)

go_df$go_term_order=factor(x = c(1:nrow(go_df)),labels = go_df$Description)
library(ggsci)
ggplot(data=go_df, aes(x=go_term_order,y=Count, fill=ONTOLOGY)) +
  geom_bar(stat="identity", width=0.8)  + 
  scale_fill_jama() + 
  theme_classic() +
  xlab("GO term") + ylab("Number of Genes") + labs(title = "The Most Enriched GO Terms")+ 
  theme(axis.text.x=element_text(face = "bold", color="gray50",angle = 60,vjust = 1, hjust = 1 ))

image.png

## 顺利完成，里面的细节稍微调调图，按需美化，又可以放文章里面了。
## 拷贝数变化的分析就到暂时到这了，让我们拭目以待下一种类型的数据。
## 以上分析根据个人理解进行分析，如有错误，请批评指正。

TCGA 拷贝数变异（CNV）数据整理（一）
TCGA 拷贝数变异（CNV）--Gistic 2.0在线分析（二）

最后编辑于：2021.03.14 23:13:33

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,179评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,229评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,032评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,533评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,531评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,539评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,916评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,813评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,568评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,654评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,354评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,937评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,918评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,152评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,852评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,378评论 2赞 342

TCGA 拷贝数变异（CNV）–使用maftools读取和汇总gistic输出文件（三）

读取和汇总gistic输出文件

可视化重要的结果

挑选q<0.25的基因

挑一个基因出来看看

找到了基因之后就可以“为所欲为了….”

推荐阅读更多精彩内容