数据结构
常见数据类型
- 向量(Vetor)
- 矩阵(Matrix)
- 数组(Array)
- 数据框(Data Frame)
- List
向量(Vetor)
定义
- 元素:数字或者字符串(用chr表示)
- 标量:一个元素组成的变量
- 向量(矢量):多个元素组成的变量,是一排有序排列的元素
举例
- x<- c(1,2,3)——向量“x”是元素1,2,3的排列,有顺序;
- x<- 1:10——从1-10之间所有的整数;
- x<- seq(1,10,by = 0.5)——1-10之间每隔0.5取一个,公差为0.5;
- x<- rep(1:3,times=2)——1-3 重复2次。
除上述外,一个向量可以是一个“数据框”。
在给定向量中提取元素
- x[4]——x第4个元素
- x[-4]——排除法,除了第4个元素之外剩余的元素,“非B”
- x[2:4]——第2到4个元素
- x[-(2:4)]——除了第2-4个元,“非(aA且B)”
- x[c(1,5)]——第1个和第5个元素
数据框(Data Frame)
获取:
- “doudou.txt”,表格文本格式,逗号间隔
- “huahua.txt”,表格文本格式,空格间隔
- 放在默认工作目录下
读取&变量赋值命令:
- 读取:
read.table(file = "huahua.txt", sep = "\t", header = T)
"sep"间隔符,header表头为真即首行做表头 - 赋值:
上述命令仅查看,赋值于变量“a”,即a可代表该数据框——a<-read.table(file = "huahua.txt", sep = "\t", header = T) - 行、列名更改:
- colnames(x)——查看列名
- rownames(x)——查看行名,默认值的行名就是行号,1/2/3/4...
- x<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)——最后row.names的意思是修改第一列为行名A/B/C/D/E
读取&变量赋值命令
- write.table(x,file = "yu.txt",sep = ",",quote=F)——分隔符改为逗号,字符串不加双引号(默认格式带由双引号),变量x数据框导出为yu.txt文件
- save(X,file="test.RData")——保存变量x
- load("test.RData")——载入保存的变量x
报错X not found
可能原因:
- 最近一次编辑删除变量x——重新定义;
- 未区分大小写——检查命令。