本想着写一篇介绍论文中各种类型图表的推送,但是着笔介绍时又觉得不如一起绘图吧!各类学术图表都万变不离其宗,以图的形式将处理后的数据展示出来(主要指的是数据展示图,还有实验拍摄图和流程示意图,这里就不讲后面的两种了)。
如果大家想要回看这个系列的内容,可以在番茄随笔公众号的“好好学习”菜单→“现学现卖”栏目里找。这个专栏主要参考《R语言·数据可视化之美·专业图表绘制指南》(后续简称为参考书),以及相关论坛、网页的内容,和大家共同学习。
我在写这篇的时候,还发现了自己去年挖的坑还没填,就是【陪你学】《Next-Generation Sequencing Data Analysis》。哈哈,会慢慢填坑的。
一、学术图表简介
学术图表包括数据展示图,实验拍摄图和流程示意图。
本专栏主要介绍数据展示图。可以使用Excel,GraphPad Prisn,Origin,Python和R等绘制数据展示图,并按照杂志等要求的分辨率和格式导出TIFF、EPS矢量图。
二、学术图表作用
图表在论文中的作用主要为:真实、准确和全面地展示数据的本质、关系和规律。
三、学术图表类型
图表的分类方法多种多样,本文根据数据着重表达的内容,将图表分为六大类:类别比较,数据关系,数据分布,时间序列,局部整体和地理空间。有些图表也可以归类于两种或多种图表类型。
1. 类别比较型:这类图表的数据一般包含数值型和类别型两种数据类型。比如柱形图,X轴为类别型数据,Y轴为数值型数据。通常用以比较数据的规模、程度、大小等。
2. 数据关系型:这类图表又可分为数值关系、层次关系和网络关系。
(1)数值关系型图表:展示两个或多个变量之间的关系,当变量为1-3个时,可使用散点图,气泡图,曲面图,韦恩图(表数值和相交关系)。变量多于3个时,使用矩阵散点图,平行坐标系,径向坐标图,星形图和切尔诺夫脸谱图等。
(2)层次关系型图表:表达个体之间的层次关系,比如包含和从属关系。包括节点链接图,树形图,冰柱图,旭日图,圆填充图,矩形树状图等。
(3)网络关系型图表:非层次关系,它表达的数据关系更自由和复杂,比如桑基图,和弦图,节点链接图,弧长链接图,蜂箱图等。
3. 数据分布型:这类图表显示数据集中的数值及其出现的频率或分布规律,比如统计直方图,箱形图,小提琴图,核密度曲线。一般用横轴表示数据类型,纵轴为分布情况。
4. 时间序列型:强调数据随时间的变化规律或趋势。X轴为时序,Y轴为数值。比如折线图,面积图,雷达图,日历图,柱形图。
5. 局部整体型:可以显示出局部组成成分与整体的占比信息,主要包括饼图,堆积图,旭日图等。
6. 地理空间型:展示数据的精确位置和地理分布规律,比如等值区间地图,带散点的地图等。
四、工具准备
1. R的下载安装
R 可以直接下载(https://cran.r-project.org/bin/windows/base/),或在CRAN(https://cran.r-project.org/mirrors.html)下载。按照提示安装。
2. RStudio的下载安装
然后安装RStudio (https://posit.co/),RStudio是R的集成开发环境 (IDE, Integrated Development Environment ),使得使用R变得更简单和高效。
3. R包的安装
安装好了RStudio,再去安装一些包(Package)就简单很多,可以在界面右下找到packages→install即可。或者输入>install.packages("ggplot2")。也可以如果安装不成功一般是路径问题,依赖包没有安装,版本不兼容或镜像源问题。
也可以直接从Github 或BitBucket 上下载安装包,需要使用devtools 包来完成:devtools::install_github("tidyverse/ggplot2")。一般Github上会有安装指导。
图3. Github页面安装指导。https://github.com/tidyverse/ggplot2