1. 豆花给新手Tips
-R的赋值符号不是等号,而是<-
-在Console 控制台输入命令,相当于Linux的命令行
-R的代码都是带括号的,括号必须是英文的。
-显示工作路径 getwd()
-向量是由元素组成的,元素可以是数字或者字符串
-表格在R语言中改名叫数据框
-函数或者命令不会用时,百度/谷歌搜索+?read.tabl
命令查看帮助,调出帮助文档
-数据类型:向量、矩阵、数组、数据框、列表
2.向量
(1)元素:数字(numeric)/字符串(charecter)等
-标量:一个元素组成的变量
-向量:多个元素组成的变量 (一个向量是一排有序排列的元素,可作为数据框中的一列)
(2)赋值:给变量定义,赋予这个变量一个数值、字符串、数据框
x<- c(1,2,3) # 常用的向量写法,意为将x定义为由元素1,2,3组成的向量
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2) #1-3 重复2次
查看变量
-右侧environment处,可以发现Values和Datas
-点击Datas中的变量,1)脚本编辑器中会出现一个数据框 2)控制台下会出现View()这个函数
(3)从向量中提取元素
-根据元素位置
x[4] #x第4个元素
x[-4] #排除法,除了第4个元素之外剩余的元素
x[2:4] #第2到4个元素
x[-(2:4)] #除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
根据值
x[x==10] # 等于10的元素
x[x>0] # 取大于0的元素
x[x %in% c(1,2,5)] # 存在于向量c(1,2,5)中的元素
3. 数据框
(1)读取本地数据
read.table(file = "doudou.txt",header =T) #默认分隔符为制表符 \t
a <- read.table(file = "doudou.txt",header =T)
read.table("doudou.txt")
b <- read.table("doudou.txt")
read.csv("doudou.txt") # 默认分隔符是","
c <- read.csv("doudou.txt")
参数设置:
-sep = " " "," "\t" #分别以空格、逗号、制表符为分隔符
-header = "T/F" # 是否将第一行作为列命
-row.names = "" #设置行名
-col.names = "" #设置列命
(2)设置行名和列名
colnames(X) # 查看列名
rownames(X) # 查看行名
(3)数据框的导出
write.table(X,file = "yu.txt")
参数设置:https://blog.csdn.net/qq_42937176/article/details/105537432
(4)变量的保存与重新加载
save.image(file="bioinfoplanet.RData")#保存当前所有变量
load("bioinfoplanet.RData")
save(X,file="test.RData") #保存其中一个变量
load("test.RData")
清空environment里面的所有变量后,分别load这两个文件看环境处呈现的变量,能更好的体会什么叫做保存一个变量和所有变量
(5)元素提取
- X[x,y] #第x行第y列
- X[x,] #第x行
- X[,y] #第y列
- X[y] #也是第y列
- X[a:b] #第a列到第b列
- X[c(a,b)] #第a列和第b列
- X$列名 #也可以提取列,可以Tab键自动补全