介绍
Python在计算中常常需要从文件中读入数据,数据文件可能包括注释、缺省值(默认值)和空行等,文件中的列可以是按照固定宽度对齐或者由一个、多个分隔符分开,而且,文件可能有描述性的首行和脚注等,导致实际使用Python的文件和字符串操作时难于处理和分析。
numpy中提供了多个从文件中读入数据的函数,最简单的为np.loadtxt,可以处理多种情况,复杂的有np.genfromtxt,可以更好的处理缺失值和脚注信息等
保存和读取文件
可以使用np.save直接以二进制方式写入numpy数组到文件中:
np.save( ' 文件名.npy' , 数组 ) #其中.npy可以省略,会默认扩展名为.npy
然后使用np.load载入存入的数组数据:
x = np.load('文件名.npy') #此时.noy扩展名必须加上
np.loadtxt
np.loadtxt函数的原型为
其中dtype指定各列的类型
comments:忽略文件中以此符号为开头的
delimiter:列与列之间的分隔符
converters:可以指定列的类型,转换为指定的类型
skiprows:跳过指定的行,默认为0
usecols:哪些列需要读取,列的索引序列
unpack:缺省范围一个多维数组,指定为true,将每列返回一个不同的变量
ndim:返回的矩阵至少有多少维度,单维轴将被压缩