原计划写一个openpyxl的操作文档,普及下python如何来操作excel,结果人家官方的文档已经写的非常完美了,就临时改主意把人家的文档翻译了一遍。可以阅读英文文档的同学,建议大家直接去看官方的API操作文档官网地址:Openpyxl
创建一个excel文件
使用openpyxl模块工作时,我们并需要在系统文件中创建一个excel文件。只需要导入Workbook类就可以了:>>> from openpyxl import Workbook>>> wb = Workbook()一个excel文件总是会自动创建至少一张表,也就是所谓的sheet
你可以通过使用命令Workbook对象名.active来获取这张sheet>>> ws = wb.active注意:active默认获取下标0的表。除非你自行指定了下标,否则你将永远都只能获取到第一张表。你可以使用命令Workbook对象.create_sheet()来创建sheet表单:>>> ws1 = wb.create_sheet("Mysheet") # insert at the end (default)# or>>> ws2 = wb.create_sheet("Mysheet", 0) # insert at first position# or>>> ws3 = wb.create_sheet("Mysheet", -1) # insert at the penultimate position自行创建的sheet表单都会自动的生成一个名字。类似与sheet、sheet1、sheet2…你随时都可以修改这个名字,只要通过属性title:wb.title = ‘new title’默认情况下,改标题表单下的表格是白色的。你可以通过属性:表单对象.sheet_properties.tabColor来设置ws.sheet_properties.tabColor = "1072BA"一旦你定义了sheet表单的标题之后,你就可以将其作为workbook对象的key来进行调用:>>> ws3 = wb["New Title"]通过sheetname属性你可以浏览workbook对象下所有sheet表单的标题>>> print(wb.sheetnames)['Sheet2', 'New Title', 'Sheet1']
你也可以循环遍历所有的sheet表单
>>> for sheet in wb:... print(sheet.title)你可以在当前文件中,创建sheet表单的副本>>> source = wb.active>>> target = wb.copy_worksheet(source)注意:只有单元格(包括值、样式、超链接和注释)和某些表格工作属性(包括尺寸、格式和属性)。不能复制所有其他文件/表单的属性,比如:图像、图表也不能在工作簿之间赋值sheet表。如果工作簿是只读或者只写的模式,那么你也不能赋值它。
操作数据
访问一个单元格
现在我们已经知道了如何取获取一个sheet表单,现在可以开始修改表单中单元格的内容了。单元格可以作为表单的key来直接访问
>>> c = ws['A4']
上面命令将会返回A4单元格,如果A4不存在的话,那命令执行完成之后会自动创建一个。可以直接进行赋值操作
>>> ws['A4'] = 4
openpyxl也提供了cell()函数。这个函数可以通过行和列更精确的访问单元格>>> d = ws.cell(row=4, column=2, value=10)
注意:
内存中的sheet表不存在任何的单元格。所有你操作的单元格都是在访问的同时创建的正是由于此特性,所以即使你没有给他们分配值,也可以通过滚动的浏览的方式在内存中创建单元格
类似于下列方法
>>> for x in range(1,101):... for y in range(1,101):... ws.cell(row=x, column=y)
这个代码块将会创建一个100*100的单元格,但没有什么实际意义
访问多个单元格
可以通过切片来访问多个单元格
>>> cell_range = ws['A1':'C2']
也可以使用类似的方法来获取行或者列的范围
>>> colC = ws['C']>>> col_range = ws['C:D']>>> row10 = ws[10]>>> row_range = ws[5:10]
你也可以使用iter_row()方法:
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):... for cell in row:... print(cell)<Cell Sheet1.A1><Cell Sheet1.B1><Cell Sheet1.C1><Cell Sheet1.A2><Cell Sheet1.B2><Cell Sheet1.C2>
同样使用iter_cols()方法可以返回列:
>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
... for cell in col:... print(cell)<Cell Sheet1.A1><Cell Sheet1.A2><Cell Sheet1.B1><Cell Sheet1.B2><Cell Sheet1.C1><Cell Sheet1.C2>
注意:
出于性能原因,Worksheet.iter_cols()方法在只读模式下不可用。
如果你需要遍历所有的行或者列的话,你可以使用row属性或者columns属性
>>> ws = wb.active
>>> ws['C9'] = 'hello world'>>> tuple(ws.rows)((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>),(<Cell Sheet.A4>, <Cell Sheet.B4>, <Cell Sheet.C4>),(<Cell Sheet.A5>, <Cell Sheet.B5>, <Cell Sheet.C5>),(<Cell Sheet.A6>, <Cell Sheet.B6>, <Cell Sheet.C6>),(<Cell Sheet.A7>, <Cell Sheet.B7>, <Cell Sheet.C7>),(<Cell Sheet.A8>, <Cell Sheet.B8>, <Cell Sheet.C8>),(<Cell Sheet.A9>, <Cell Sheet.B9>, <Cell Sheet.C9>))
>>> tuple(ws.columns)
((<Cell Sheet.A1>,<Cell Sheet.A2>,<Cell Sheet.A3>,<Cell Sheet.A4>,<Cell Sheet.A5>,<Cell Sheet.A6>,...<Cell Sheet.B7>,<Cell Sheet.B8>,<Cell Sheet.B9>),(<Cell Sheet.C1>,<Cell Sheet.C2>,<Cell Sheet.C3>,<Cell Sheet.C4>,<Cell Sheet.C5>,<Cell Sheet.C6>,<Cell Sheet.C7>,<Cell Sheet.C8>,<Cell Sheet.C9>))
注意:
处于性能原因的考虑,columns属性在只读模式下不可以用
仅获取单元格的值
如果你只是想获取sheet表单中的值的话,可以使用属性valus。这将遍历工作表中所有的行,但仅返回单元格的值for row in ws.values: for value in row: print(value) iter_rows()和iter_cols()函数通过参数 values_only也都可以之返回值>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):... print(row)(None, None, None)(None, None, None)
数据存储
一旦我们有了一个单元格之后,我们可以指定它的值>>> c.value = 'hello, world'>>> print(c.value)'hello, world'>>> d.value = 3.14>>> print(d.value)
3.14
保存到文件
最简单以及最安全的用来保存workbook的方法,是通过使用workbook类对象的save()方法>>> wb = Workbook()>>> wb.save('balances.xlsx')注意:此操作将会重写已存在的文件内容,并且不会给出警告文件名扩展名不是强制为xlsx或xlsm,如果你不使用官方扩展名,那你可能无法通过其他应用程序直接打开此文件。由于OOXML文件基本上是ZIP文件,因此您也可以使用自己喜欢的ZIP存档管理器将其打开。
存储为流
如果你想将文件保存到流对象中,比如,在你使用一些像Pyramid、Flask或者Django这样的web框架时,你只需要通过一个NameTemporaryFile()对象>>> from tempfile import NamedTemporaryFile>>> from openpyxl import Workbook>>> wb = Workbook()>>> with NamedTemporaryFile() as tmp: wb.save(tmp.name) tmp.seek(0) stream = tmp.read()
你可以设置属性template=True,将workbook对象保存为一个模板
>>> wb = load_workbook('document.xlsx')>>> wb.template = True>>> wb.save('document_template.xltx')或者将属性设置为False(默认值),将workbook对象保存为一个文件>>> wb = load_workbook('document_template.xltx')>>> wb.template = False>>> wb.save('document.xlsx', as_template=False)加载已有的文件与创建文件相同,通过openpyxl.load_workbook()可以打开一个现有的文件>>> from openpyxl import load_workbook>>> wb2 = load_workbook('test.xlsx')>>> print wb2.sheetnames['Sheet2', 'New Title', 'Sheet1']