一、R语言的安装
我所做的R语言学习主要是为应对工作上的生信分析,如果你是往这个方向走,那么这篇文章很大可能会帮助你。如果你也是有python基础的话,那我写的可能会更対你口味。
不过现在看到这篇文章可能比较杂乱,到时候等我学完会做个完整的系统整理。
第一步,安装R:https://www.r-project.org/
第二步,安装RStudio:http://www.rstudio.com/ide
至于背景知识,百度一下会比较详细,重点的话你要知道R是基于S语言做出来的,而R是由Ross Ihaka,Robert Gentleman这两位
统计学家
做出来的,广泛用于统计学领域的
可编程语言
至于你又会问那么RStudio又是什么,如果你学习过python,就会知道python有一个叫pycharm的玩意,说简单点其实就是一个IDE工具,你说我可不可以不用,当然可以,你甚至可以不安装R,牛逼的人一般都是用记事本编程的。
对于RStudio,你需要注意镜像源要切换到国内,不一定都能用,一个不行换另外一个,像是我广州的镜像源就用不了,镜像源更换在这里可以找到。(tools最下面一个选项。)
二、R数据结构及类型
历史的经验告诉我,对于数据类型的理解一定要够深入,否则以后的BUG会多到头疼。因此我在网上搞到这么一张图,但目前我学习的知识有限,在以后的学习中可能会不断回头复习数据类型。
没想到用什么样的方式表达数据类型,实战还是少了点。
0.赋值
#以下内容均在RStudio中书写
> a = 1
> a
[1] 1
> a <- 2
> a
[1] 2
#以上两种写法都是对a进行赋值,虽然教程上说不推荐用第一种写法,但是Python里面就是这么写的啊,多优雅,我就推荐萌新写第一种,第二种还要多打一个字符,多累啊。
1.向量vector
#c是一个内置函数,他能把数组合起来变成向量,比如这样
> a = c(1,2,3)
> b = c(2,3,4)
> a
[1] 1 2 3
> b
[1] 2 3 4
#这里顺便说个常用的功能,如果你不知道这个函数怎么用,你可以用
?c
#的方法,在右侧help界面会弹出这个函数的使用说明,十分便利。
萌新可能就会一堆问题了,比如我就喜欢钻牛角尖,能不能用这种,这种,或者这种
> a = 1 2 3
Error: unexpected numeric constant in "a = 1 2"
> a = 1,2,3
Error: unexpected ',' in "a = 1,"
> a = (1,2,3)
Error: unexpected ',' in "a = (1,"
虽然打脸啪啪响,但我觉得多尝试很重要,这对你充分理解数据含义会非常有帮助。
那么你会说,写成向量有什么用?
这时候,你可以View一下。(函数首字母大写!函数首字母大写!)
#view也是一种函数
> View(a)
按我的理解,向量就是一组具有一定关系的数据,他们可能是姓名,学号,得分等等。
接下来就会有疑问,那么组成向量的基础数据类型是什么?应该是数值吧,可以是其他吗?判断变量的数据类型用class
#class是个用于判断数据类型的函数,大概是十分常用的测BUG方法。
> ?class
> a = c("1","2","3")
> a
[1] "1" "2" "3"
> class(a)
[1] "character"
> a = c(1,"2",3)
> a
[1] "1" "2" "3"
> class(a)
[1] "character"
> a = c(1,2,3)
> class(a)
[1] "numeric"
character和numeric,这是两种不同的数据类型,应该上面说的数值型和字符型,当然还有因子型和布尔型,那么很重要的,这些数据有什么不一样。
> a = c("1","2",3)
> a
[1] "1" "2" "3"
> View(a)
> class(a)
[1] "character"
>
> a = c(1,2,3)
> a
[1] 1 2 3
> View(a)
> class(a)
[1] "numeric"
#这是两种不同的数据类型,但是都能完成向量和绘图,而且在绘图中肉眼上比较难辨别两个数据的差异,这个地方在未来数据使用中一定是个大坑,多加留意。
三、画一个差异表达矩阵
好了,现在你已经学会了1+1 = 2,那么让我们愉快的实战吧。
接下来,你将花费你人生中的1小时,来完成这个包的安装,这里参考的是https://www.jianshu.com/p/9134a2b25520,但这位兄台比较粗心,错了好几个地方,比如simpleaffy就打错了。
library(simpleaffy)
另外一个,请把这个54m的压缩文件下载下来:https://ftp.ncbi.nlm.nih.gov/geo/series/GSE20nnn/GSE20986/suppl/
完了你就可以按照教程中部署环境,安装。
最后提示一下,他这一句,写出来也是有问题的,你要把txt打开,更改一下对应的位置关系。
write.table(phenodata, "data/tex1.txt",quote = F, sep = "\t",row.names = FALSE,col.names = TRUE)
完了你就可以做出很优秀的图啦