🤠 WGCNA | 不止一个组的WGCNA怎么分析嘞!?~(二)(共识网络分析-第二步-构建网络与模块-分步法)

写在前面

不知道各位最近过得怎么样,昨天去修了脚🦶,感觉自己马上就要迈入油腻中年人的行列了。🥲

不过说实话,还是挺舒服的,值得再去一次。😅

接着更一下WGCNA的教程吧,还是值得大家好好学习一下的。🙃

今天介绍的是分步法创建网络与识别模块,这种比较适合有个性化需求的人使用,如果你是懒癌晚期,可以直接看上一篇教程。😘

用到的包

rm(list = ls())
library(tidyverse)
library(WGCNA)

示例数据

我们还是和之前一样,把之前清洗好的输入数据拿出来吧。😗

load("./Consensus-dataInput.RData")

提取数据集个数

首先和之前一样提取一下我们的数据集个数,后面会用到。🤓

nSets <-  checkSets(multiExpr)$nSets

挑选软阈值并可视化

5.1 创建power

powers <-  c(seq(4,10,by=1), seq(12,20, by=2))

5.2 计算power

和之前一样,我们为每个数据集计算一下power,挑选软阈值。🥰

powerTables = vector(mode = "list", length = nSets)
for (set in 1:nSets){
  
powerTables[[set]] = list(data = pickSoftThreshold(multiExpr[[set]]$data, powerVector=powers,

                                                   verbose = 2)[[2]])
collectGarbage()
}

5.3 可视化相关参数设置

设置一下绘图的参数,方便可视化。😂

colors = c("black", "red")
plotCols = c(2,5,6,7)
colNames = c("Scale Free Topology Model Fit", "Mean connectivity", "Median connectivity",
"Max connectivity")

ylim = matrix(NA, nrow = 2, ncol = 4);
for (set in 1:nSets)
{
for (col in 1:length(plotCols))
{
ylim[1, col] = min(ylim[1, col], powerTables[[set]]$data[, plotCols[col]], na.rm = TRUE);
ylim[2, col] = max(ylim[2, col], powerTables[[set]]$data[, plotCols[col]], na.rm = TRUE);
}
}

5.4 可视化一下吧

来绘一下图吧。🐵

sizeGrWindow(8, 6)
par(mfcol = c(2,2));
par(mar = c(4.2, 4.2 , 2.2, 0.5))
cex1 = 0.7;
for (col in 1:length(plotCols)) for (set in 1:nSets)
{
if (set==1)
{
plot(powerTables[[set]]$data[,1], -sign(powerTables[[set]]$data[,3])*powerTables[[set]]$data[,2],
xlab="Soft Threshold (power)",ylab=colNames[col],type="n", ylim = ylim[, col],
main = colNames[col]);
addGrid();
}
if (col==1)
{
text(powerTables[[set]]$data[,1], -sign(powerTables[[set]]$data[,3])*powerTables[[set]]$data[,2],
labels=powers,cex=cex1,col=colors[set]);
} else
text(powerTables[[set]]$data[,1], powerTables[[set]]$data[,plotCols[col]],
labels=powers,cex=cex1,col=colors[set]);
if (col==1)
{
legend("bottomright", legend = setLabels, col = colors, pch = 20) ;
} else
legend("topright", legend = setLabels, col = colors, pch = 20) ;
}

网络邻接的计算

网络构建首先需要使用软阈值计算各个数据集中的邻接关系,前面计算的power6哦。😂

softPower <-  6
adjacencies <-  array(0, dim = c(nSets, nGenes, nGenes))

for (set in 1:nSets){
  adjacencies[set, , ] <-  abs(cor(multiExpr[[set]]$data, use = "p"))^softPower
  }

拓扑重叠的计算

接着我们把邻接矩阵转换成拓扑重叠矩阵,也就是计算一下我们常说的TOM。🐵

TOM <-  array(0, dim = c(nSets, nGenes, nGenes))

for (set in 1:nSets){
  TOM[set, , ] <-  TOMsimilarity(adjacencies[set, , ])
  }

给TOM做个scale

8.1 scale一下

不同数据集的TOM可能具有不同的统计特性,可能会导致偏差。😭

为了让两个数据集有可比性,我们需要做一下scale。😋

scaleP = 0.95
set.seed(12345)
nSamples = as.integer(1/(1-scaleP) * 1000)
scaleSample = sample(nGenes*(nGenes-1)/2, size = nSamples)
TOMScalingSamples = list()
scaleQuant = rep(1, nSets)
scalePowers = rep(1, nSets)

for (set in 1:nSets){
  TOMScalingSamples[[set]] = as.dist(TOM[set, , ])[scaleSample]
  scaleQuant[set] = quantile(TOMScalingSamples[[set]],
                             probs = scaleP, type = 8)

if (set>1){
  scalePowers[set] = log(scaleQuant[1])/log(scaleQuant[set])
  TOM[set, ,] = TOM[set, ,]^scalePowers[set]
}
  }

8.2 可视化scale效果

我们做个Q-Q plot来看下scale的效果吧。🤨

做完以后离参考线更近了,当然这种变化比较小就是了。🤣

scaledTOMSamples = list()

for (set in 1:nSets){
scaledTOMSamples[[set]] = TOMScalingSamples[[set]]^scalePowers[set]
}

sizeGrWindow(6,6)

qqUnscaled = qqplot(TOMScalingSamples[[1]], TOMScalingSamples[[2]], plot.it = T, cex = 0.6,
                    xlab = paste("TOM in", setLabels[1]), ylab = paste("TOM in", setLabels[2]),
                    main = "Q-Q plot of TOM", pch = 20)

qqScaled = qqplot(scaledTOMSamples[[1]], scaledTOMSamples[[2]], plot.it = FALSE)

points(qqScaled$x, qqScaled$y, col = "red", cex = 0.6, pch = 20);
abline(a=0, b=1, col = "blue")
legend("topleft", legend = c("Unscaled TOM", "Scaled TOM"), pch = 20, col = c("black", "red"))

共识拓扑重叠的计算

计算完成后,假设我们有一个基因在两个数据集中表达,如何认为它是差异基因呢 ️❓

根据WGCNA中的解释,如果这个基因在两个数据集中差异都很大,这个时候我们才认为它是一个变化差异大的基因,就像达成共识一样。😜

consensusTOM = pmin(TOM[1, , ], TOM[2, , ])

聚类与模块识别

10.1 计算模块

consTree <-  hclust(as.dist(1-consensusTOM), method = "average")
minModuleSize <-  30
unmergedLabels <-  cutreeDynamic(dendro = consTree, distM = 1-consensusTOM,
                                 deepSplit = 2, cutHeight = 0.995,
                                 minClusterSize = minModuleSize,
                                 pamRespectsDendro = F)

unmergedColors <-  labels2colors(unmergedLabels)
table(unmergedLabels)

10.2 可视化

sizeGrWindow(8,6)

plotDendroAndColors(consTree, unmergedColors, "Dynamic Tree Cut",
                    dendroLabels = F, hang = 0.03,
                    addGuide = T, guideHang = 0.05)

10.3 计算模块MEs

可以用于后面合并相似模块哦。🤠

unmergedMEs <-  multiSetMEs(multiExpr, colors = NULL, universalColors = unmergedColors)

consMEDiss <-  consensusMEDissimilarity(unmergedMEs)

consMETree <-  hclust(as.dist(consMEDiss), method = "average")

10.4 可视化聚类结果

sizeGrWindow(7,6)
par(mfrow = c(1,1))

plot(consMETree, main = "Consensus clustering of consensus module eigengenes",
     xlab = "", sub = "")

abline(h=0.25, col = "red")

10.5 合并

merge <-  mergeCloseModules(multiExpr, unmergedLabels, cutHeight = 0.25, verbose = 3)

10.6 提取重要数据

moduleLabels <-  merge$colors
moduleColors <-  labels2colors(moduleLabels)
consMEs <-  merge$newMEs

10.7 最终可视化

sizeGrWindow(9,6)

plotDendroAndColors(consTree, cbind(unmergedColors, moduleColors),
                    c("Unmerged", "Merged"),
                    dendroLabels = F, hang = 0.03,
                    addGuide = T, guideHang = 0.05)

Save一下

老规矩,保存一下我们辛辛苦苦运行的数据吧。🎩

save(consMEs, moduleColors, moduleLabels, consTree, file = "./Consensus-NetworkConstruction-man.RData") 

<center>最后祝大家早日不卷!~</center>


点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

<center> <b>📍 往期精彩 <b> </center>

📍 <font size=1>🤩 WGCNA | 值得你深入学习的生信分析方法!~</font>
📍 <font size=1>🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!</font>
📍 <font size=1>🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?</font>
📍 <font size=1>🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)</font>
📍 <font size=1>🤩 scRNA-seq | 吐血整理的单细胞入门教程</font>
📍 <font size=1>🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~</font>
📍 <font size=1>🤩 RColorBrewer | 再多的配色也能轻松搞定!~</font>
📍 <font size=1>🧐 rms | 批量完成你的线性回归</font>
📍 <font size=1>🤩 CMplot | 完美复刻Nature上的曼哈顿图</font>
📍 <font size=1>🤠 Network | 高颜值动态网络可视化工具</font>
📍 <font size=1>🤗 boxjitter | 完美复刻Nature上的高颜值统计图</font>
📍 <font size=1>🤫 linkET | 完美解决ggcor安装失败方案(附教程)</font>
📍 <font size=1>......</font>

本文由mdnice多平台发布

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容