原计划写一个openpyxl的操作文档,普及下python如何来操作excel,结果人家官方的文档已经写的非常
完美了,就临时改主意把人家的文档翻译了一遍。可以阅读英文文档的同学,建议大家直接去看官方的
API操作文档
官网地址:Openpyxl
创建一个excel文件
使用openpyxl模块工作时,我们并需要在系统文件中创建一个excel文件。只需要导入Workbook类就可以
了:
>>> from openpyxl import Workbook
>>> wb = Workbook()
一个excel文件总是会自动创建至少一张表,也就是所谓的sheet
新梦想技术分享
你可以通过使用命令Workbook对象名.active来获取这张sheet
>>> ws = wb.active
注意:active默认获取下标0的表。除非你自行指定了下标,否则你将永远都只能获取到第一张表。
你可以使用命令Workbook对象.create_sheet()来创建sheet表单:
>>> ws1 = wb.create_sheet("Mysheet") # insert at the end (default)
# or
>>> ws2 = wb.create_sheet("Mysheet", 0) # insert at first position
# or
>>> ws3 = wb.create_sheet("Mysheet", -1) # insert at the penultimate position
自行创建的sheet表单都会自动的生成一个名字。类似与sheet、sheet1、sheet2…你随时都可以修改这
个名字,只要通过属性title:
wb.title = ‘new title’
默认情况下,改标题表单下的表格是白色的。你可以通过属性:表单对象.sheet_properties.tabColor
来设置
ws.sheet_properties.tabColor = "1072BA"
一旦你定义了sheet表单的标题之后,你就可以将其作为workbook对象的key来进行调用:
>>> ws3 = wb["New Title"]
通过sheetname属性你可以浏览workbook对象下所有sheet表单的标题
>>> print(wb.sheetnames)
['Sheet2', 'New Title', 'Sheet1']
你也可以循环遍历所有的sheet表单
>>> for sheet in wb:
... print(sheet.title)
你可以在当前文件中,创建sheet表单的副本
>>> source = wb.active
>>> target = wb.copy_worksheet(source)
注意:
只有单元格(包括值、样式、超链接和注释)和某些表格工作属性(包括尺寸、格式和属性)。不能复
制所有其他文件/表单的属性,比如:图像、图表
也不能在工作簿之间赋值sheet表。如果工作簿是只读或者只写的模式,那么你也不能赋值它。
操作数据
访问一个单元格
现在我们已经知道了如何取获取一个sheet表单,现在可以开始修改表单中单元格的内容了。单元格可以
作为表单的key来直接访问
>>> c = ws['A4']
上面命令将会返回A4单元格,如果A4不存在的话,那命令执行完成之后会自动创建一个。可以直接进行
赋值操作
>>> ws['A4'] = 4
openpyxl也提供了cell()函数。
这个函数可以通过行和列更精确的访问单元格
>>> d = ws.cell(row=4, column=2, value=10)
注意:
内存中的sheet表不存在任何的单元格。所有你操作的单元格都是在访问的同时创建的正是由于此特性,
所以即使你没有给他们分配值,也可以通过滚动的浏览的方式在内存中创建单元格
类似于下列方法
>>> for x in range(1,101):
... for y in range(1,101):
... ws.cell(row=x, column=y)
这个代码块将会创建一个100*100的单元格,但没有什么实际意义
访问多个单元格
可以通过切片来访问多个单元格
>>> cell_range = ws['A1':'C2']
也可以使用类似的方法来获取行或者列的范围
>>> colC = ws['C']
>>> col_range = ws['C:D']
>>> row10 = ws[10]
>>> row_range = ws[5:10]
你也可以使用iter_row()方法:
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
... for cell in row:
... print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.B1>
<Cell Sheet1.C1>
<Cell Sheet1.A2>
<Cell Sheet1.B2>
<Cell Sheet1.C2>
同样使用iter_cols()方法可以返回列:
>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
... for cell in col:
... print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.A2>
<Cell Sheet1.B1>
<Cell Sheet1.B2>
<Cell Sheet1.C1>
<Cell Sheet1.C2>
注意:
出于性能原因,Worksheet.iter_cols()方法在只读模式下不可用。
如果你需要遍历所有的行或者列的话,你可以使用row属性或者columns属性
>>> ws = wb.active
>>> ws['C9'] = 'hello world'
>>> tuple(ws.rows)
((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>),
(<Cell Sheet.A4>, <Cell Sheet.B4>, <Cell Sheet.C4>),
(<Cell Sheet.A5>, <Cell Sheet.B5>, <Cell Sheet.C5>),
(<Cell Sheet.A6>, <Cell Sheet.B6>, <Cell Sheet.C6>),
(<Cell Sheet.A7>, <Cell Sheet.B7>, <Cell Sheet.C7>),
(<Cell Sheet.A8>, <Cell Sheet.B8>, <Cell Sheet.C8>),
(<Cell Sheet.A9>, <Cell Sheet.B9>, <Cell Sheet.C9>))
>>> tuple(ws.columns)
((<Cell Sheet.A1>,
<Cell Sheet.A2>,
<Cell Sheet.A3>,
<Cell Sheet.A4>,
<Cell Sheet.A5>,
<Cell Sheet.A6>,
...
<Cell Sheet.B7>,
<Cell Sheet.B8>,
<Cell Sheet.B9>),
(<Cell Sheet.C1>,
<Cell Sheet.C2>,
<Cell Sheet.C3>,
<Cell Sheet.C4>,
<Cell Sheet.C5>,
<Cell Sheet.C6>,
<Cell Sheet.C7>,
<Cell Sheet.C8>,
<Cell Sheet.C9>))
注意:
处于性能原因的考虑,columns属性在只读模式下不可以用
仅获取单元格的值
如果你只是想获取sheet表单中的值的话,可以使用属性valus。这将遍历工作表中所有的行,但仅返回
单元格的值
for row in ws.values:
for value in row:
print(value)
iter_rows()和iter_cols()函数通过参数 values_only也都可以之返回值
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
... print(row)
(None, None, None)
(None, None, None)
数据存储
一旦我们有了一个单元格之后,我们可以指定它的值
>>> c.value = 'hello, world'
>>> print(c.value)
'hello, world'
>>> d.value = 3.14
>>> print(d.value)
3.14
保存到文件
最简单以及最安全的用来保存workbook的方法,是通过使用workbook类对象的save()方法
>>> wb = Workbook()
>>> wb.save('balances.xlsx')
注意:
此操作将会重写已存在的文件内容,并且不会给出警告
文件名扩展名不是强制为xlsx或xlsm,如果你不使用官方扩展名,那你可能无法通过其他应用程序直接
打开此文件。
由于OOXML文件基本上是ZIP文件,因此您也可以使用自己喜欢的ZIP存档管理器将其打开。
存储为流
如果你想将文件保存到流对象中,比如,在你使用一些像Pyramid、Flask或者Django这样的web框架时,
你只需要通过一个NameTemporaryFile()对象
>>> from tempfile import NamedTemporaryFile
>>> from openpyxl import Workbook
>>> wb = Workbook()
>>> with NamedTemporaryFile() as tmp:
wb.save(tmp.name)
tmp.seek(0)
stream = tmp.read()
你可以设置属性template=True,将workbook对象保存为一个模板
>>> wb = load_workbook('document.xlsx')
>>> wb.template = True
>>> wb.save('document_template.xltx')
或者将属性设置为False(默认值),将workbook对象保存为一个文件
>>> wb = load_workbook('document_template.xltx')
>>> wb.template = False
>>> wb.save('document.xlsx', as_template=False)
加载已有的文件
与创建文件相同,通过openpyxl.load_workbook()可以打开一个现有的文件
>>> from openpyxl import load_workbook
>>> wb2 = load_workbook('test.xlsx')
>>> print wb2.sheetnames
['Sheet2', 'New Title', 'Sheet1']