走到这里,也代表热图这个系列到最终篇了。最后我们说说一些奇形怪状的热图。其实小编也发现,生物学现在整的不太好的一个方面就是发论文大家太注重图了,反倒忽略了数据的价值。我是认为用合理的图将数据价值表现出来即可,稍加修饰,无需太过。
但是很多小伙伴总是看到别人文章新奇的图,比较感兴趣,所以这里也示范一下一些新奇的热图,仅限于小编自己见过的!其他的小伙伴们可以留言分享。
一、环状热图
顾名思义,环状热图就是圆形的热图,将长形的热图卷一下就可以了。它唯一的好处可能就是热图太长的时候节省空间!
用circlize函数画图(ggplot2也可以实现,这里我们不再展示,有兴趣可以去网上查查)
首先加载数据并处理:
setwd("D:/物信息学/环形热图")
A <- read.csv("行列注释.csv", header = T, row.names = 1)
A <- as.matrix(A) #将表达矩阵转化为matrix
for (i in 1:nrow(A)) A[i, ] <- scale(log(unlist(A[i, ] + 1), 2)) #对数据进行标准化处理
annotation_row = data.frame(Pathway = c(rep("Wnt",20), rep("Inflammatory",32),rep("HIF",34)))#对行进行注释,用于后续的热图分裂
row.names(annotation_row) <- rownames(A)
annotation_row <- as.matrix(annotation_row)#在circlize函数中,需要为matrix
加载需要的包:
library(circlize)
library(dendextend)
设置颜色,画图:
col_color = colorRamp2(c(-2, 0, 2), c("#003399", "white", "#cccc00"))#设置legend颜色,范围
circos.heatmap(A, col = col_color,
dend.side = "inside",#聚类放在环形内测
rownames.side = "outside",#基因名放在环形外侧
split = annotation_row,#用行注释分裂热图
bg.border = "black")#背景边缘颜色
circos.clear()#画完图结束。一定要运行这个,不然后续画图会叠加
但是这样没有行名,也没有分组信息,也没有legend,需要额外添加。
circos.par(gap.after = c(2, 2,30))#让分裂的一个口大一点,可以添加行信息
circos.heatmap(A, col = col_color,
dend.side = "inside",
rownames.side = "outside",
split = annotation_row,
bg.border = "black",
show.sector.labels = T)
#以下代码用于显示分组,但是很复杂
circos.track(track.index = get.current.track.index(), panel.fun = function(x, y) {
if(CELL_META$sector.numeric.index == 3) { # the last sector
cn = colnames(A)
n = length(cn)
circos.text(rep(CELL_META$cell.xlim[2], n) + convert_x(1, "mm"),
1:n - 0.5, cn,
cex = 0.5, adj = c(0, 0.5), facing = "inside")
}
}, bg.border = NA)
#添加legend
library(ComplexHeatmap)
lgd = Legend(title = "Scale", col_fun = col_color)
grid.draw(lgd)
分组行名还是需要手动调整。
二、三角热图
总是在某些文章中(可能高分文章作图比较有性格吧)出现不一样的热图,除了上述讲的环状,还有三角热图,可以理解为热图只显示斜对角一半。
利用ComplexHeatmap正常加载数据处理,画热图加一个函数和改变参数就可以实现。
setwd("D:/生物信息学/环形热图")
A <- read.csv("行列注释.csv", header = T, row.names = 1)
A <- as.matrix(A) #将表达矩阵转化为matrix
for (i in 1:nrow(A)) A[i, ] <- scale(log(unlist(A[i, ] + 1), 2)) #对数据进行标准化处理
Heatmap(A, rect_gp = gpar(type = "none"), column_dend_side = "bottom",
cell_fun = function(j, i, x, y, w, h, fill) {
if(as.numeric(x) <= 1 - as.numeric(y)) {
grid.rect(x, y, w, h, gp = gpar(fill = fill, col = fill))
}
})
这个热图基因表达量的时候真的没有什么意义。不过这种热图我们应该熟悉,一般用在相关系数的表达上,下三角是热图,上三角是数字,不过不是用这个函数实现的。
我们不妨做一下相关性分析及其可视化,或许在这里不会做无用功。
数据还是表达量数据,不过需要原始数据,不在经过做热图标准化那一步。
加载需要的数据包,并计算相关性和P值:
library(ggcorrplot)
library(ggthemes)
#计算这几个样本的相关性
sample_cor <- round(cor(A),3)
#计算P值,看显著性
sample_P <- round(cor_pmat(A),3)
画图:
ggcorrplot(sample_cor,#计算的相关系数矩阵
method = 'circle',#热图显示为圆圈
hc.order = T,#聚类
hc.method = "ward.D",#聚类方法
outline.color = "white",
ggtheme = theme_bw(),
type = "upper",#显示上三角
colors = c("#6D9EC1","white","#E46726"),#热图颜色
lab = T,#热图上显示相关系数
lab_size = 2.5)
为了让这个图更加有意义,我们只显示P≤0.05的相关,也就是显著的。
ggcorrplot(sample_cor,#计算的相关系数矩阵
method = 'circle',#热图显示为圆圈
hc.order = T,#聚类
hc.method = "ward.D",#聚类方法
outline.color = "white",
ggtheme = theme_bw(),
type = "upper",#显示上三角
colors = c("#6D9EC1","white","#E46726"),#热图颜色
lab = T,#热图上显示相关系数
lab_size = 2.5,
p.mat = sample_P,#相关
insig = "pch")#不显著的显示为X或者空白
走到这里,我想热图系列已经很圆满很丰富了,我们更多的还是要关注数据的实际意义,以及在适当的时候用合适的热图尽可能的表现数据意义!
系列结束总是给人一种轻松,祝大家学习愉快!
请大家多多支持关注和分享,有更多精彩内容!
更多精彩内容可关注KS科研分享与服务科研学习交流于分享,生信学习笔记,科研经历和生活!