写在前面,为什么想着写单细胞转录组分析的教程?
一方面是可以进一步巩固自己对单细胞转录组分析的理解,另一方面也可以通过自己现有的微薄单细胞数据分析理解,带领更多感兴趣的小伙伴一同加入这个领域来,为国家的科研事业尽一份绵薄之力吧(听起来有点扯,不过没关系)。接下去,我会抽空陆续更新单细胞分析的教程,但由于自身精力有限(正在准备考研),或许更新不及时,请谅解。
就目前生物学的发展趋势,单细胞转录组分析的重要性毋容置疑,相信在不久的将来将会像传统转录组那样成为实验室的标配技术之一。所以,学会这一门技术是必要而且有意义的。
在开展单细胞分析之前,第一步自然需要相关软件准备及环境的配备
单细胞转录组数据分析主要用到的是R语言、Linux。那么接下来我大概说一下R语言的安装:
R语言安装程序的官方下载链接:https://cran.r-project.org/
在选择版本时,大家千万不要选择最新版(4.0以上),因为目前的大多数R包都暂时不支持此版本。
我目前使用的版本是3.5.1以及3.6.2。这里需要说明一下,R是支持在同一台电脑里同时装多个R版本的,只要大家在安装时把安装路径改一下便可。这里不再详述。
还有一个关键的软件便是RStudio。
Rstudio的下载链接:https://rstudio.com/products/rstudio/download/
正常下载安装便可。
在这些主要的软件都准备就绪后,接下来便是安装单细胞分析常规的必备R包。
大家在安装前,可以先把镜像切换一下,操作方法可用代码也可直接在Rstudio的tool选项中的global options进行设置,个人建议第二种,因为在每次分析时就不用重复运行那些代码,镜像可选清华、中科大,看个人喜好。
必要包的安装
install.packages("devtools")
install.packages("BiocManager")
install.packages("tidyverse")
install.packages('Seurat')
install.packages('cowplot')
install.packages('ggplot2')
BiocManager::install(c("SingleR","monocle", "DESeq2"),ask = F,update = F)
BiocManager::install(c("clusterProfiler","DOSE","pheatmap"),ask = F,update = F)
BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db","org.Rn.eg.db"),ask = F,update = F)
devtools::install_github('RGLab/MAST', upgrade=F, build_vignettes = T)
相信大家经常有遇到无法从github上直接下载并安装包,这里给大家提供一个解决办法,就是从github上下载(可利用码云快速下载)zip包后离线手动安装:
library(rJava)
library(devtools)
library(usethis)
devtools::install_local("C:\\Users\\Administrator\\Desktop\\test\\Rscript\\MAST.zip") #镜像选择all-- 1
最后还有一点需要提醒的是,在安装好seurat后,加载它时(只有首次运行会提示),会弹出说需要下载安装minconda和python,选Y便可。
对于某些R包老是安装都不成功的问题,我这里给出比较常见的可能,一般来说时由于版本问题,这里的版本可能是R的版本,也可能是R包的版本,看情况,另外,还有一种常见的可能,是因为你安装的这个R包的一些依赖包你没有装齐全,所以导致安装失败。这里提供一种查看某个R包依赖包的方法:
使用gtools来查看
install.packages("gtools")
library(gtools)
> getDependencies('Seurat')
[1] "ps" "processx" "callr" "prettyunits" "backports"
[6] "desc" "pkgbuild" "rprojroot" "rstudioapi" "evaluate"
[11] "pkgload" "praise" "sys" "bitops" "testthat"
[16] "askpass" "yaml" "stringi" "tidyselect" "assertthat"
[21] "BH" "plogr" "gtools" "gdata" "caTools"
[26] "colorspace" "stringr" "utf8" "sitmo" "gtable"
[31] "digest" "globals" "listenv" "glue" "isoband"
[36] "withr" "plyr" "curl" "mime" "openssl"
[41] "R6" "magrittr" "pkgconfig" "zoo" "htmltools"
[46] "viridisLite" "base64enc" "htmlwidgets" "tidyr" "hexbin"
[51] "dplyr" "lazyeval" "crosstalk" "purrr" "data.table"
[56] "promises" "rappdirs" "gplots" "farver" "labeling"
[61] "lifecycle" "munsell" "reshape2" "gridExtra" "httpuv"
[66] "xtable" "sourcetools" "later" "crayon" "fastmap"
[71] "spatstat.data" "spatstat.utils" "deldir" "abind" "tensor"
[76] "polyclip" "goftest" "cli" "ellipsis" "fansi"
[81] "pillar" "vctrs" "FNN" "RSpectra" "dqrng"
[86] "ape" "cowplot" "fitdistrplus" "future" "future.apply"
[91] "ggplot2" "ggrepel" "ggridges" "httr" "ica"
[96] "igraph" "irlba" "jsonlite" "leiden" "lmtest"
[101] "miniUI" "patchwork" "pbapply" "plotly" "png"
[106] "RANN" "RColorBrewer" "Rcpp" "RcppAnnoy" "reticulate"
[111] "rlang" "ROCR" "rsvd" "Rtsne" "scales"
[116] "sctransform" "shiny" "spatstat" "tibble" "uwot"
[121] "RcppEigen" "RcppProgress"
这样,我们的单细胞转录组分析的环境搭建完毕。
大家遇到什么问题的,可以留言,看到的话,我会解答。