R语言readr包的使用
- readr包中的读写函数比正常R语言数据的读写快了很多倍
- 主要的包有两个,一个数readr包,一个是readxl 包
- readr包中的主要的函数有:
read_csv,read_delim,read_table,write_delim,write_csv,write_excel_csv,write_delim
函数,其中read_table
中分隔符是指定为固定空格的,不能修改分隔符,函数read_delim
可以指定分隔符
- readxl包中有两个函数,一个是
read_excel
,可以用来读取excel的xls和xlsx文件,另外一个是excel_sheets
可以查看excel文件中的表的名字
- 例子
# readxl包读excel文件挺快,但是不能直接写入xlsx文件中,此时可以使用xlsx包
#(此包需要java支持)
x <- read_excel("x.xlsx",sheet=2);
write_excel_csv(x,path = "x1.csv",append=T)
#用read_delim函数读写179M文件
system.time(x <- read_delim("数据样本.txt",delim="|",col_names = c("type","userid","region","city","action"),append=T))
#耗时大概5秒,delim参数为指定的分隔符,相当于sep函数,append参数设置文件