Day5-数据结构
思维导图
笔记
向量
赋值
x<- c(1,2,3) #常用的向量写法,意为将x定义为由元素1,2,3组成的向量。
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2) #1-3 重复2次
取值
位置
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框——表格在R语言中改名叫数据框(Data frame)
数据放在你的工作目录下
命令
命令1 read.table
命令2 read.csv
逗号格式还是空格格式的数据源都可以,区别就在于列数不对等:1严格要求所有列都对等,2会按最大列,或指定的列数填充,空串可指定相应的字符或数字填充。
参数
sep:分开数据的分隔符。默认sep=""。
header:文件第一行有没有包含逻辑变量。如果header=T,就是第一行要比数据列的数量少一列。
quote:引号字符集,默认双引号,不用的话就是quote = " "。
查看和导出
查看列:colnames(X)
查看行:rownames(X)
修改左上角第一格的命名colnames(X)[1]<-"T"#左上一空白会自动补为X
导出命令write.table(X,file = "yu.txt",sep = ",",quote=F)
保存变量save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="1.RData")
再次使用变量load("1.RData")
提取变量中元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)
回答问题
因为没有赋值给变量X,比如一直用的变量x,直接输入X<-x即可
部分来自《生信星球》