R读取Excel、R与本机文件
以下内容是我在R语言学习过程中的每一课的重点笔记记录。
16 R语言读入本机文件
1.每类文件都会使用对应的分隔符,例如用逗号分隔的文件为.csv文件,读取方式为:x <- read.table(“data.csv”)或使用绝对路径C:/Users/……
2.head(x) tail(x) 显示x对象首尾6行的内容(默认为6行)
head(x,n=10),一次显示10行内容
3.read.table()函数在使用时,若是.csv文件应设置sep=”,”,所以应提前知道文件的分隔符是什么,此函数中有以下参数:
① header设置第一行是否跳过,默认为FALSE
② skip表示跳过某些内容,如开头的注释
(例如设置skip=5,表示跳过前5行的信息)
③ nrows=100,控制读取到第100行,而skip表示从哪里开始读
④ na.strings表示哪些内容是缺失值
⑤ stingsAsFactors 控制读入的字符串是否转化为因子,默认为TRUE
4.read.csv/csv2/delim/delim2 适合特定格式的文件,delim的分隔符为制表符
5.read.fwf()读取特定宽度的文件
read.fwf(“fwf.txt”,widths=c(3,3)),即给出每一列的宽度值
17 R语言读入网络文件
1.read.table(https://codeload......,header=TRUE)
此为网络文本文件的具体位置,而并非网页文件
2.读取网络表格文件:
①安装与加载包:install.packages(“XML”) ;library(XML)
②查看包文档:?readHTMLTable,里面的which参数指选取网页的哪个表格,但注意尽量不要用R文件处理网页文件
3.读取任何其他格式文件都可先转换为csv或txt文件,而后read.table()即可
4.help(package=”foreign”)可以查看很多的read函数
5.读取剪贴板内容:
read.table(“clipboard”,header=T,sep=”,”)或者直接readClipboard()
6.读取不规则格式的文件:
readLines(“….”,n=5)按照行读取文件
scan()
18 读写Excel文件
1. 最简单的方法:将Excel文件存储为csv格式,之后在R中read.csv()即可,即:x <- read.csv(“文件名.csv”,header=TRUE),或是命令:read.table(“clipBoard”,seq=”,”,header=TRUE)
2.readClipboard(): 读取剪贴板的内容
3.使用XLConnect包读取Excel文件,但计算机必须配置JAVA的运行环境,此分为一步法与两步法:
① 两步法:首先读取工作簿,即整个Excel文件(workbook)
(1) library(XLConnect)
(2) x<-loadWorkbook(“data.xlsx”)
(3) readWorksheet(x,1) 1,代表读取第一个工作表,2代表第二个,读取后直接保存为数据框;其还有startRow, startCol, endRow, endCol,header参数
② 一步法:readWorksheetFromFile(“文件名”)
4.使用XLConnect包读取R文件,此分为四步法与一步法:
① 四步法:
(1)创建工作簿:x <-loadWorkbook(‘file.xlsx”,create=T)
(2) 创建工作表:createSheet (x, ”Sheet1”)
(3)数据保存:
writeWorksheet(x,data=mtcars,sheet=”Sheet1”)
(4) 将工作簿存储为Excel文件:
saveWorkbook(x)
②一步法:
writeWorksheetToFile(“file.xlsx”, data=iris, sheet=“Sheet 1”) ;其还有startRow, startCol, endRow, endCol,header参数
此包还有对电子表格函数处理等功能,更多内容可查看包文档,vignette(“XLConnect”)
5. 利用xlsx包读取
library(xlsx)
read.xlsx(“data.xlsx”,1,startRow=1,endRow=100)
写入时:
write.xlsx(x,file=”a.xlsx”,sheetName=”Sheet 1”,append=F)(设定是否追加写入)
19 读写R格式文件
1.R本身提供了两种存储文件的格式:.RDS(存储单个R对象)与.Rdata(保存多个R对象)
2.以iris数据集为例,存储RDS文件:
saveRDS(iris,file=”iris.RDS”)
x <- readRDS(“iris.RDS”)
3.load(“.Rdata”)加载Rdata文件,此在现有文件的基础上直接加载,之前的变量并不会消失,所以尽量在右上角进行查看当前的变量变化情况
4.save(iris,iris3,file=”iris.Rdata”)保存Rdata文件
5.save.image()可保存当前所有对象
欢迎关注我的个人微信公众号:全哥的学习生涯,里面分享的是关于自己医学专业上的学习经验,与本专业之外包括日语、英语以及数据分析中的重点知识汇总、学习方法与心得,当然,还有我自己的保研历程与经验、一些生活上的感悟等等