跟着张旭东老师学ggplot2绘制火山图

基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

R Markdown

  • 可生成html文件
  • 完成后点击Knit, 可生成Markdown文本文件
  • R Markdown升级版Bookdown

导入数据

read.table(file = 'de_result.tab', sep = '\t')

加载包

library(ggplot2)
library(ggsci) # ggplot扩展包,内含不同级别期刊的标度

准备框架

ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) # 创建画布
ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) + geom_point() + # 绘制散点图,添加散点几何对象,“+”用来接后面的添加工具
theme_bw() # 换主题,可以试theme_classic, theme_test等,theme_bw适合科研用

将 direction 映射到点的颜色

  • 让火山图中上调、下调、ns的基因对应的点有不同的颜色
  • commands
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction)) +
    scale_color_npg() +
    theme_bw()
  • 标注
    • aes 为表示映射的函数
    • scale_color_xxx() 利用ggsci包配色,npg为Nature的高度, jco等,还有很多

标度

  • 对于图表颜色、样式等,不同的期刊有不同的喜好
  • ggsci是ggplot的扩展包,记载了SCI不同级别期刊的不同喜好
  • scale_color_xxx() # 标度调色板。xxx处为对应期刊,详见帮助文档

自定义修改颜色

  • 需要制定颜色对应项的顺序,需要自定义调色板
  • commands
    library(tidyverse)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    my_palette <- c('green', 'grey', 'red')

    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction)) +
    scale_color_manual(values = my_palette) +
    theme_bw()
  • 标注
    • direction一列只有up/ns/down三个值,为离散型变量——无序,将离散型变量排序后为因子型变量——有序;
    • 使用mutate需要加载tidyverse;
    • mutate可以修改列的数据类型,修改为因子型变量——有序;
    • my_palette参数中传入的是自定义的颜色,可以试试颜色my_palette <- c('#E64B35FF', '#999999', '#4DBBD5FF'),数据映射的顺序与因子的顺序一致,若没有定义因子顺序,默认离散变量的排序为字母顺序
    • scale_color_manual() 传入自己的参数
  • 颜色调整
    • 深沉的颜色相对好看
    • 网上查找“16进制颜色”

修改点的大小

  • log2FC越大的点越大
  • commands
    library(ggplot2)
    library(tidyverse)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction, size = abs(log2FoldChange))) +
    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    theme_bw()
  • 标注
    • geom_point(aes(size = ?)) 调节点大小的映射值
    • abs求绝对值
    • scale_size(range = ?) 定制点的大小,一般为0.1-2或0.1-3

增加透明度(选加)

library(tidyverse)
de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
my_palette <- c('green', 'grey', 'red')
ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
geom_point(aes(color = direction,
size = abs(log2FoldChange),
alpha = abs(log2FoldChange))) +
scale_color_manual(values = my_palette) +
scale_size(range = c(0.1, 2)) +
theme_bw()

点的形状

  • 有边框的点和无边框的点有差别


    ggplot中的点形状
  • commands
    library(ggplot2)
    library(tidyverse)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(shape = 21,
    alpha = 1/2,
    color = 'black'
    ,
    aes(fill = direction,
    size = abs(log2FoldChange))) +
    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    theme_bw()
  • 标注
    • shape指定有边框的点
    • alpha = 1/2指定全部颜色透明度
    • color指定边框颜色
    • fill指定填充颜色映射值

添加阈值线

  • R语言线的类型


    线的类型
  • commands
    library(ggplot2)
    library(tidyverse)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction, size = abs(log2FoldChange))) +
    geom_hline(yintercept = -log10(0.05), linetype = 'dashed', size = 0.2) +
    geom_vline(xintercept = c(-1, 1), linetype = 'dashed')
    +
    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    theme_bw()

  • 标注

    • geom_hline()绘制水平线,geom_vline()绘制垂直线;
    • yintercept指定线的y轴值,xintercept指定线的x轴值;
    • 坐标轴的值是通过计算得到的,不能用数值直接指定
    • 虚线——dashed
    • size调整线的粗细,一般用默认的即可
    • color调整线的颜色,默认黑色

添加标签

  • commands
    library(ggplot2)
    library(tidyverse)
    library(ggrepel)

    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    top_de <- filter(de_result,
    abs(log2FoldChange) > 2 & padj < 1e-50)

    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction, size = abs(log2FoldChange))) +
    geom_hline(yintercept = -log10(0.05), linetype = 'dashed', size = 0.2) +
    geom_vline(xintercept = c(-1, 1), linetype = 'dashed') +
    geom_label_repel(data = top_de, aes(label = id)) +
    ylim(c(0, 200)) +

    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    theme_bw()
  • 标注
    • ggrepel包用于加标签(自动避免标签重叠)
    • 给关键点添加标签
    • 使用filter需要加载tidyverse包
    • 注意padj指定值的表示方式
    • 如果想要指定加标签的点,则top_de赋值改为如下操作
      top_de <- filter(de_result, id == 'HF01786')
    • geom_label_repel()指定标签及映射的值
    • ylim筛掉太大的已经被研究过的点,防止值太大的点影响其他基因在图中的显示

设置坐标轴名字及标题

  • commands
    library(ggplot2)
    library(tidyverse)
    library(ggrepel)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    top_de <- filter(de_result,
    abs(log2FoldChange) > 2 & padj < 1e-50)
    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction, size = abs(log2FoldChange))) +
    geom_hline(yintercept = -log10(0.05), linetype = 'dashed', size = 0.2) +
    geom_vline(xintercept = c(-1, 1), linetype = 'dashed') +
    geom_label_repel(data = top_de, aes(label = id)) +
    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    labs(x = 'log2 fold change',
    y = '-log10(P value)',
    title = 'Vocano Plot'
    size = 'log2 fold change') +

    theme_bw() +
    theme(plot.title = element_text(size = 18, hjust = 0.5))
  • 标注
    • labs设置x轴、y轴、图例(size)及全图的标题
    • theme_bw主题中标题靠左,想要居中要自己设置,不过要注意顺序,先肯定theme_bw
    • theme()更改主题中设置,plot.title = element_text()给标题设置,size → 字体,hjust = 0/0.5/1 → 靠左/居中/靠右,vjust可设置纵向居中

修改图例

  • commands
    library(ggplot2)
    library(tidyverse)
    library(ggrepel)
    de_result <- mutate(de_result, direction = factor(direction, levels = c('up', 'ns', 'down')))
    top_de <- filter(de_result,
    abs(log2FoldChange) > 2 & padj < 1e-50)
    my_palette <- c('green', 'grey', 'red')
    ggplot(data = de_result, aes(x = log2FoldChange, y = -log10(padj))) +
    geom_point(aes(color = direction, size = abs(log2FoldChange))) +
    geom_hline(yintercept = -log10(0.05), linetype = 'dashed', size = 0.2) +
    geom_vline(xintercept = c(-1, 1), linetype = 'dashed') +
    geom_label_repel(data = top_de, aes(label = id)) +
    scale_color_manual(values = my_palette) +
    scale_size(range = c(0.1, 2)) +
    labs(x = 'log2 fold change',
    y = '-log10(P value)',
    title = 'Vocano Plot'
    size = 'log2 fold change') +
    guides(size = FALSE) +
    theme_bw() +
    theme(plot.title = element_text(size = 18, hjust = 0.5),
    legend.background = element_blank(),
    legend.key = element_blank(),
    legend.position = c(0.93, 0.85))
  • 标注
    • guides()去除一个图例
    • theme中legened.background 设置图例文字背景,legend.key设置图例图像背景,使背景变透明,不要遮盖图中的网格线,
    • legned.position限定图例位置,默认为legend.position = 'right', 想画在图中需要手动调整
    • legend.position = c(x,y), 0→1为坐标轴最小到最大,手动调整,多次换值

图片导出

  • 方法一
    Rstudio导出pdf格式,不要用PNG
  • 方法二
    画图前声明pdf文件,打开一个pdf文件
    pdf(file = 'p1.pdf')
    ggplot(... ...) # 画图省略
    dev.off()

总结

  • 1.图层:颜色、透明度、性状等的调整为全局调整;
  • 2.映射:对应的点颜色、透明度、性状等属性有不同分类;
  • 3.标度:控制映射的规律
  • 4.主题:颜色是否好看
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342