为什么要读取文件
如果程序需要输入很多数据,简单到统计一次考试的一个班学生的成绩,复杂至基因簇相互作用。一般处理这些大量数据的方式,当然不是手敲键盘啦。
对于这种状况,如同我们之前学习的 R语言 一样,Python 也可以用到将来自外部文件导入数据的方法。
首先我们得找到自己的数据文件——
- 如果数据文件和脚本文件不在同个文件夹下,或者离脚本相对很远,就要用到绝对路径
- 如果数据文件和脚本文件在同一个文件夹下,就可以用相对路径。
第一步:打开文件
打开文件的方法有两种,使用绝对路径、或者相对路径。
# 绝对路径
file = open('D:\R\Py-data\#022.txt')
# 相对路径
file = open('..\Py-data\#022.txt')
相对路径和 HTML 的相对路径的使用是一样的,脚本文件所在的文件夹,和数据文件所在的文件夹,处于同一个项目文件夹下,所以先用【../】由脚本所在文件夹 出来 ,到项目文件夹中,再用【\Py-data】进入数据文件夹中,再用【#022.txt】打开数据文件。
第二步:读出数据
和 R 不一样的是,R 读取数据是直接 read.txt 、read.csv 这样的。
nodes2 <- read.csv("D:\\RRR\\R_for_Fun\\data\\_02_network_NODES.csv", header=T, as.is=T)
则需要先open再read,两步操作(暂时,其实后面还是有相似的)
file = open('..\Py-data\#022.txt')
data = file.read()
print(data)
file.close()
对文件的操作完成之后,如果不再使用这个数据文件,最好使用 close() 关闭文件,释放资源。虽然在我们这个学习程序里面没有多大影响,但是这个会影响到以后大型、对复杂数据、庞大数据的处理速度。所以还是请提早养成好的习惯。