还是老习惯,给出官网教程,至于你是看还是不看,它就在那里,等着你的深入研究~
https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
往期教程:
WGCNA分析图文详解专题中要解释的第四张图,这张图有点不好理解啊。
官方注释:
Figure 2: A scatterplot of Gene Signifificance (GS) for weight vs. Module Membership (MM) in the brown module. There is a highly signifificant correlation between GS and MM in this module.
这张图是一个相关性结果绘制成的散点图,虽然只是一个简单的散点图,但是理解起来怕是有点费劲哟。曾经有个客户就在这个图上纠结理解了好久。也不知道他最后明白了没有。
图剖成这几个部分:
1.横坐标:Module Membership in brown module,翻译过来就是:在棕色模块中的模块成员。模块成员是什么鬼?
2.纵坐标:Gene Significance (GS) for weight,关于体重这个性状的基因显著性。基因显著性又是什么鬼?
3.这个图是为了说明啥呢?
小面我们来一一解读。如有理解错误,还请各位大侠批评指正。
1.横坐标:MM
官方定义:
官方说明2:
For each module, we also define a quantitative measure of module membership MM as the correlation of the module eigengene and the gene expression profile.
即:模块的eigengene和基因表达谱之间的相关性。
说的是啥呢,其实就是所有基因表达谱与这个模块的eigengene的相关性(cor)。最后是一个具有所有用来做WGCNA分析基因数长的向量,每一个值代表这个基因与模块之间的关系。如果这个值的绝对值接近0,那么这个基因就不是这个模块中的一部分,如果这个值的绝对值接近1,那么这个基因就与这个模块高度相关。
一般,每个模块中的基因都会与被分配到的模块高度相关,表明了模块内部高度的连接性。
其实这个值与后面hub基因的选择相关,这里以后再讲。
2.纵坐标:GS
官方定义:
官方说明2:
We quantify associations of individual genes with our trait of interest (weight) by defining Gene Significance GS as (the absolute value of) the correlation between the gene and the trait.
GS为:基因和表型性状比如体重之间的相关性的绝对值。
总的来说,就是为了将表型特征信息与共表达网络联合起来,比如体重与哪个模块高度相关。
详细一点专业一点就是:每一个基因的表达值与表型性状之间的相关性的绝对值。0表示这个基因与这个性状不相关,1表示高度相关。如果一个模块中的基因都有这个性状高度相关,那么这个模块也就与这个性状高度相关。
3.图中的每一个点
那么计算MM与GS的相关性是为了说明什么呢?
官方教程以体重和棕色模块进行了举例说明,就是本文中的那张图片,解释如下:
Clearly, GS and MM are highly correlated, illustrating that genes highly significantly associated with a trait are often also the most important (central) elements of modules associated with the trait. The reader is encouraged to try this code with other significance trait/module correlation (for example, the magenta, midnightblue, and red modules with weight).
图中的每一个点代表一个基因,应该有3600个点。横坐标值表示基因与模块的相关性,纵坐标值表示基因与表型性状的相关性,这里可以看出与性状高度显著相关的基因往往是与这个性状显著相关的模块中的重要元素。
大家可以去验证一下自己的结果,如果一个性状与模块显著相关,那么这里GS与MM也会显著相关。
重点!!!实例说明
下图是小编自己做WGCNA分析时的一个结果,第三期教程中的那张图片显示,Blue模块与F-48小时高度相关。
下图展示了F-48小时性状的GS值与blue模块MM值的相关性,这里可以看出来是高度相关。与模块高度相关的那些点(右上角)同时也是与性状高度相关的基因;而左下角,与模块相关性不高的那些基因同时也是与性状不相关的那些基因,他们的相关性一致,这里才会出现GS与MM值高度相关。
今天就说到这里,欢迎大家留言讨论。我们下期再见~
参考资料:
1.https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2.A General Framework for Weighted Gene Co-Expression Network Analysis, Stat Appl Genet Mol Biol. 2005;4:Article17. Epub 2005 Aug 12