Python 学习笔记9 - IO编程

文件读写

读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)

读文件

open() 函数用于打开一个文件对象

f = open('/Users/michael/test.txt', 'r')

标示符'r'表示读

如果文件不存在,open() 函数就会抛出一个 IOError 的错误

如果文件打开成功,调用 read()方法可以一次读取文件的全部内容,Python 把内容读到内存,用一个 str 对象表示

str1 = f.read()

最后一步是调用close()方法关闭文件

f.close()

为了确保文件能正确被关闭,可用 try ... finally

try:
    f = open('/path/to/file', 'r')
    print(f.read())
finally:
    if f:
        f.close()

with 语句来自动帮我们调用 close() 方法:

with open('/path/to/file', 'r') as f:
    print(f.read())
  • read() 会一次性读取文件的全部内容
  • read(size) 每次最多读取size个字节的内容
  • readline() 每次读取一行内容
  • readlines() 一次读取所有内容并按行返回list

file-like Object

open() 函数返回的这种有个read() 方法的对象,在 Python 中统称为 file-like Object 。除了file外,还可以是内存的字节流,网络流,自定义流等等

file-like Object不要求从特定类继承,只要写个read()方法就行

字符编码

指定读取文件的编码(默认 utf-8):

f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')

遇到有些编码不规范的文件,你可能会遇到 UnicodeDecodeError ,因为在文本文件中可能夹杂了一些非法编码的字符

open() 函数还接收一个 errors 参数,表示如果遇到编码错误后如何处理

最简单的方式是直接忽略:

f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')

二进制文件

要读取二进制文件,用 'rb' 模式打开文件即可:

f = open('/Users/michael/test.jpg', 'rb')
f.read()

写文件

写文件调用 open() 函数时,传入标识符 'w' 或者 'wb' 表示写文本文件或写二进制文件:

f = open('/Users/michael/test.txt', 'w')
f.write('Hello, world!')
f.close()
with open('/Users/michael/test.txt', 'w') as f:
    f.write('Hello, world!')

当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘

StringIO 和 BytesIO

StringIO

把str写入StringIO:

from io import StringIO

# 创建一个StringIO
f = StringIO()

# 返回字符数
f.write('hello')

# 获得写入后的str
print(f.getvalue())

像读文件一样读取StringIO:

from io import StringIO

f = StringIO('Hello!\nHi!\nGoodbye!')

while True:
    s = f.readline()
    if s == '':
        break
    print(s.strip())

BytesIO

from io import BytesIO

f = BytesIO()

# 返回字节数
f.write('中文'.encode('utf-8'))

print(f.getvalue())
from io import BytesIO

f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')

f.read()

操作文件和目录

Python 内置的 os 模块也可以直接调用操作系统提供的接口函数

import os

# 操作系统类型,如果是 posix,说明系统是Linux、Unix或Mac OS X,如果是nt,就是Windows系统
os.name

# 获取详细的系统信息,在Windows上不提供
os.uname()

# 获取在操作系统中定义的环境变量
os.environ

# 获取某个环境变量的值
os.environ.get('PATH')
os.environ.get('x', 'default')

操作文件和目录

操作文件和目录的函数一部分放在 os 模块中,一部分放在 os.path 模块中

# 查看当前目录的绝对路径
os.path.abspath('.') ==> 'C:\\Users\\lianwx'

# 列出当前路径下的所有文件和子目录
os.listdir('.')

# 判断路径下是否目录
os.path.isdir('path')

# 判断路径下是否文件
os.path.isfile('path')

# 合并、拆分路径的函数并不要求目录和文件要真实存在,它们只对字符串进行操作
# 在某个目录下创建一个新目录,首先把新目录的完整路径表示出来
os.path.join('C:\\Users\\lianwx', 'testdir')

# 拆分路径
os.path.split('/Users/michael/testdir/file.txt') ==> ('/Users/michael/testdir', 'file.txt')

# 得到文件扩展名
os.path.splitext('/path/to/file.txt') ==> ('/path/to/file', '.txt')

# 创建一个目录
os.mkdir('/Users/michael/testdir')

# 删掉一个目录
os.rmdir('/Users/michael/testdir')

# 对文件重命名
os.rename('test.txt', 'test.py')

# 删掉文件
os.remove('test.py')

# 复制文件
# 读写文件可以完成文件复制
# 使用 `shutil` 模块的 `copyfile()` 函数

利用Python的特性来过滤文件

# 列出当前目录下的所有目录
[x for x in os.listdir('.') if os.path.isdir(x)]

# 列出所有的.py文件
[x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py']

序列化

Python提供了 pickle 模块来实现序列化

pickle.dumps() 方法把任意对象序列化成一个 bytes

pickle.dump() 直接把对象序列化后写入一个 file-like Object

把一个 dict 序列化并写入文件:

import pickle

d = dict(name='Bob', age=20, score=88)

# 得到一个bytes,然后,就可以把这个bytes写入文件
pickle.dumps(d)


f = open('dump.txt', 'wb')

# 直接把对象序列化后写入一个file-like Object
pickle.dump(d, f)

f.close()

反序列化:

pickle.loads() 方法把 bytes 反序列化出对象

pickle.load() 方法从一个file-like Object中直接反序列化出对象

f = open('dump.txt', 'rb')

d = pickle.load(f)

f.close()

JSON

Python 内置的 json 模块提供了非常完善的 Python 对象到 JSON 格式的转换

json.dumps() 方法返回一个 str ,内容就是标准的 JSON

json.dump() 方法可以直接把 JSON 写入一个 file-like Object

import json

d = dict(name='Bob', age=20, score=88)

json.dumps(d)

json.loads() 方法把JSON的字符串反序列化

json.load() 方法从file-like Object中读取字符串并反序列化

json_str = '{"age": 20, "score": 88, "name": "Bob"}'

json.loads(json_str)

JSON进阶

序列化一个 class

默认情况下,dumps() 方法不知道如何将一个实例变为一个 JSON 的 {} 对象

dumps() 方法还提供了一大堆的可选参数 ,其中参数 default 接受一个函数,函数可传入一个对象,返回一个 dict,作为转换函数

通常class的实例都有一个 __dict__ 属性,它就是一个 dict ,用来存储实例变量。也有少数例外,比如定义了slots的class。

import json

class Student(object):
    def __init__(self, name, age, score):
        self.name = name
        self.age = age
        self.score = score

s = Student('Bob', 20, 88)

print(json.dumps(s, default=lambda obj: obj.__dict__))

把JSON反序列化为一个 Student 对象实例,loads() 方法首先转换出一个 dict 对象,然后,我们传入的 object_hook 函数负责把 dict 转换为 Student 实例:

def dict2student(d):
    return Student(d['name'], d['age'], d['score'])
    
json_str = '{"age": 20, "score": 88, "name": "Bob"}'

print(json.loads(json_str, object_hook=dict2student))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容

  • IO编程概念 IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由C...
    时间之友阅读 719评论 0 0
  • 本文是笔者学习廖雪峰Python3教程的笔记,在此感谢廖老师的教程让我们这些初学者能够一步一步的进行下去.如果读者...
    相关函数阅读 1,462评论 2 9
  • 文件读写 读写文件是最常见的IO操作。Python内置了读写文件的函数,用法和C是兼容的。由于文件读写时都有可能产...
    时间之友阅读 454评论 0 0
  • IO在计算机中是指input/output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU这个超快...
    Sun_atom阅读 1,688评论 0 0
  • 在 阿多尼斯的《门后的童年》里读到这样一段:自从你认识了自己的路,你真正的失落便开始了:你把双肩交付给谁,...
    blairbellac阅读 223评论 0 1