Document 文档概念
python-docx可以 创建新文档及修改现有文档。事实上它主要还是用于修改现存文档。
文档 的表现,很大程度上,取决于删除所有文本内容后剩下的部分。样式、页眉和页脚之类与文本内容是分离的。可以在文档开始前设置大量的自定义项,这样自定义项会在生成的文档中表现出来。
文档 有两个主要操作,打开及保存文档。
打开新建文档
这里第一句代码(from docx import Document)指从python-docx库(docx)里面引用Document。
from docx import Document
document = Document()
document.save('test.docx')
这会从内置的默认模板新建文档,并保存为“test.docx”。所谓的“默认模板”实际上是一个空白的Word文件,与安装的python docx库一起存储。
真正打开文档
要修改现存文档,需要带文件名:
from docx import Document
document=Document('existing-document-file.docx')
document.save('new-file-name.docx')
注意事项:
可以用这种方式打开任何Word 2007或更高版本的文件(.Word 2003或更早版本的文档文件不起作用)。
如果打开和保存的文件名相同,python docx会覆盖原始文件。
打开“类文件”文档
python docx可以从所谓的类文件对象中打开文档。它还可以保存为一个类文件对象。便于通过网络连接或从数据库获取源或目标文档。这意味着您可以传递打开的文件或StringIO/BytesIO流对象,来打开或保存文档。
f=open('foobar.docx','rb')
document=Document(f)
f.close()
#or
with open('foobar.docx', 'rb') as f:
source_stream = StringIO(f.read())
document = Document(source_stream)
source_stream.close()
...
target_stream = StringIO()
document.save(target_stream)
内容源于PyPI。
原始手册内容可参考:https://python-docx.readthedocs.io/en/latest/user/documents.html。