目前R中绘制热图的方式有很多,常用的如pheatmap、ComplexHeatmap包等,这里再给大家介绍一个轻量级的R包-HeatmapR包,即无需过多的前期数据处理,可同时可视化含有离散型和连续性的矩阵。
Github地址:https://github.com/DillonHammill/HeatmapR
准备数据
## 按照R包
devtools::install_github("DillonHammill/HeatmapR")
library(HeatmapR)
## 准备数据
data <- mtcars
data <- data[sample(nrow(data),20),]
head(data)
> str(data)
'data.frame': 20 obs. of 11 variables:
$ mpg : num 21.4 17.8 32.4 30.4 18.1 27.3 22.8 21 19.2 16.4 ...
$ cyl : num 4 6 4 4 6 4 4 6 8 8 ...
$ disp: num 121 167.6 78.7 75.7 225 ...
$ hp : num 109 123 66 52 105 66 93 110 175 180 ...
$ drat: num 4.11 3.92 4.08 4.93 2.76 4.08 3.85 3.9 3.08 3.07 ...
$ wt : num 2.78 3.44 2.2 1.61 3.46 ...
$ qsec: num 18.6 18.9 19.5 18.5 20.2 ...
$ vs : num 1 1 1 1 1 1 1 0 0 0 ...
$ am : num 1 0 1 1 0 1 1 1 0 0 ...
$ gear: num 4 4 4 4 3 4 4 4 3 3 ...
$ carb: num 2 4 1 2 1 1 1 4 2 3 ...
目前,数据集里各列都是数值型的数据,先简单出图看下效果。
基础绘图
library(HeatmapR)
heat_map(
data,
scale = "column",
scale_method = "range", # "range", "mean" or "zscore" 三种标准化方式
tree_x = TRUE, ## 显示X轴聚类
tree_y = TRUE, ##显示Y轴聚类
tree_cut_x = 4, ## 行分割数
tree_cut_y = 12, ##列分割数
cell_text = TRUE, ## 显示数值
cell_text_col = 'black',
cell_size = TRUE, ## 控制大小
cell_shape = "diamond", #设置性状
title = "mtcars"
)
添加缺失值并改变数据类型
此包的便捷性在于可将同时含有连续性和离散型矩阵可视化热图,这里随机添加几个缺失值,并改变cyl列的数据为因子类型,然后再绘制热图看下效果。
## 添加NA值并改变某列为因子型
data[c(2, 19, 14, 7), 3] <- NA
data[c(4, 9, 17, 20), 4] <- NA
data$cyl <- factor(data$cyl)
str(data)
> str(data)
'data.frame': 20 obs. of 11 variables:
$ mpg : num 21.4 17.8 32.4 30.4 18.1 27.3 22.8 21 19.2 16.4 ...
$ cyl : Factor w/ 3 levels "4","6","8": 1 NA 1 1 2 1 NA 2 3 3 ...
$ disp: num 121 167.6 78.7 NA 225 ...
$ hp : num 109 123 66 52 105 66 93 110 175 180 ...
$ drat: num 4.11 3.92 4.08 4.93 2.76 4.08 3.85 3.9 3.08 3.07 ...
$ wt : num 2.78 3.44 2.2 1.61 3.46 ...
$ qsec: num 18.6 18.9 19.5 18.5 20.2 ...
$ vs : num 1 1 1 1 1 1 1 0 0 0 ...
$ am : num 1 0 1 1 0 1 1 1 0 0 ...
$ gear: num 4 4 4 4 3 4 4 4 3 3 ...
$ carb: num 2 4 1 2 1 1 1 4 2 3 ...
## 绘制热图
heat_map(
data,
scale = "column",
scale_method = "range", # "range", "mean" or "zscore" 三种方式
tree_x = TRUE, ## 显示X轴聚类
tree_y = TRUE, ##显示Y轴聚类
tree_cut_x = 4,
tree_cut_y = 12,
cell_text = TRUE,
cell_text_col = 'black',
#cell_size = TRUE, ## 控制大小
cell_shape = "diamond", #设置性状
title = "mtcars",
cell_col_empty = "red",
cell_col_scale = c( ##连续性数据配色
'#2ab49b',
'white',
'#ea7f58'
),
cell_col_palette = c( ##离散型数据配色
"#197fcd",
"#00c347",
"#fb3b65"
),
cell_col_alpha = 1
)
其它功能
添加柱状图
heat_map(
data,
cell_col_scale = c( ##连续性数据配色
'#2ab49b',
'white',
'#ea7f58'
),
scale = "column",
scale_method = "range",
bar_values_x = 1:ncol(mtcars),
bar_size_x = 0.5,
bar_fill_x = rainbow(ncol(mtcars)),
bar_line_col_x = "black",
bar_values_y = 1:nrow(mtcars),
bar_size_y = 0.8,
bar_fill_y = rainbow(ncol(mtcars)),
bar_line_col_y = "black",
title = "heatmap with bar plots"
)
该包参数非常多,也基本涵盖了热图常用的调参细节,如添加行与列分组注释,聚类方法设置,图例与导出等等,感兴趣的可以参考HeatmapR • HeatmapR (dillonhammill.github.io)指南进行学习,这里不再一一介绍了。