用ggplot2做一个箱图--写给刚刚开始用ggplot2作图的同仁

作图思路

  1. 首先要设计好需要作图类型。我展示组与组之间比较某一指标的差异的情况比较多,这个一般选用箱图。但是为了表达更多的信息,有时也会把单个数据以点图的形式叠加展示出来。

  2. 一般不同的组都会用不同的颜色表示,这样颜色的搭配就成为了一个问题,怎样更美观又不会太花哨。

  3. 组与组之间的比较还会做统计结果的标注,标记星号或者p值,一般来说标记星号就够了。

选择包

library(ggplot2)  
library(ggsci)    # 颜色
library(ggsignif) # 增加统计标记

做一个基本的图

ggplot(data = mtcars, aes(x = as.factor(gear), y = mpg)) + geom_boxplot() + 
  labs(x = "Gears", y = "MPG") + 
  theme_classic()
Rplot.png

  以上是一个最基本的箱图,它展示了数据的整体分布情况。但是一般文献里还会把每一个数据点也都展示出来,那就应该是下面这个样子。

ggplot(data = mtcars, aes(x = as.factor(gear), y = mpg)) +
  geom_boxplot() + 
  geom_dotplot(binaxis = "y", stackdir = "center") +
  labs(x = "Gears", y = "MPG") + 
  theme_classic()
Rplot01.png

  大家看到的用到的geom_dotplot()这样一个图形。我初学时第一反应是geom_point()。尝试一下就可以看出差别来,geom_point()所有点都是一列,重叠的点区分不出,geom_dotplot()对点的位置进行调整,把相互重叠点区分开来了。
  这里引出来ggplot的一个概念,“图层”。实际上我们是在geom_boxplot()上面又覆盖了一层geom_dotplot()图层。为什么是覆盖呢?你可以尝试把代码中两个geom的位置互换一下,你就会看到,box会掩盖掉一部分dots。

美化美化

  下面就是颜色的问题了。如何给不同的组标上不同的颜色以示区分呢?这个对于ggplot2来说很简单。

ggplot(data = mtcars, aes(x = as.factor(gear), y = mpg, color = as.factor(gear))) + 
  geom_boxplot() + 
  geom_dotplot(aes(fill = as.factor(gear)), binaxis = "y", stackdir = "center") +
  labs(x = "Gears", y = "MPG") + 
  guides(color = guide_legend("Gear"), fill = guide_legend("Gear")) +
  scale_color_aaas() + 
  scale_fill_aaas() + 
  theme_classic()
Rplot02.png

  简单说一下上面的代码。默认大家能理解在aes()中增加color = as.factor(gear)的含义(应该是涉及到映射的概念,大家百度或gg一下映射,或者颜色映射应该很容易找到相关的解释)。请注意一下geom_dotpot()中增加了fill = as.factor(gear)。这是因为对于一个点来说,它包含了边和内部两个部分。color设定的是边的颜色,这个是从ggplot()里面的aes()继承下来的,所以不用再次设定。而填充的颜色则是fill,需要在这里设定一下。
  相对应的后面增加了两个scale,scale_color_aaas()scale_fill_aaas(),对应于color和fill各一个。aaas是美国科学促进会,出版science的,上面的函数表示会把color和fill的颜色设定成science风格的颜色。这个函数来自于ggsci包,是很有意思的一个ggplot2的相关包,对于颜色选择障碍认识很有帮助。
  好的目前为止,似乎已经完成了我前面说的前两点了。下面来完成第3点,增加统计学标记。

ggplot(data = mtcars, aes(x = as.factor(gear), y = mpg, color = as.factor(gear))) + 
  geom_boxplot() + 
  geom_dotplot(aes(fill = as.factor(gear)), binaxis = "y", stackdir = "center") +
  geom_signif(comparisons = list(c("3", "4")), map_signif_level = T) +
  labs(x = "Gears", y = "MPG") + 
  guides(color = guide_legend("Gear"), fill = guide_legend("Gear")) +
  scale_color_aaas() + 
  scale_fill_aaas() + 
  theme_classic()
Rplot03.png

  大家看到这回有增加了一个geom_signif,其内部的参数设置的意思是标出“3”和“4”之间( comparisons)的统计学差异的显著性水平(map_signif_level = T表示标注星号,否则标注p值)。为什么仅标注了3和4之间的差异呢?事实上其他的比较对也可以增加,通过comparisons = list(c("3", "4"), c("3", "5"))这样类似的可以添加多个比较对,但是本数据中其他比较对统计学差异不显著,因此这里省略了,没有添加。当然添加统计学差异的标记还有一个用的很广的ggpubr包。对于我来说,ggsignif包中调整标记位置之类的函数记得相对清楚一点,但是ggpubr中的参数记得不清楚,还总是混。读者感兴趣可以多了解一下ggpubr包。

有点像样了吧

  至此,一个有点像样的图做出来了,解决了有还是没有的问题,但其实问题还是挺多的,比如横纵坐标的字体,有的杂志都是有要求的。字号调整大小也是问题,还有颜色调整的问题(颜色是很个性化的,有些人就是偏执于自己喜欢的颜色,看不上science的配色),图形比例问题等。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335