#coding:utf-8
import os
import pandas as pd
from PyPDF2 import PdfReader
# 指定要读取的文件夹路径
folder_path = r'E:/临时文件/'
# 获取文件夹下的所有PDF文件
pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
# 存储PDF文件的页码信息
pdf_page_info = []
# 遍历每个PDF文件
# for file_name in pdf_files:
#使用enumerate()函数来同时获取循环的次数和元素值,index来写编号
for index,file_name in enumerate(pdf_files):
file_path = os.path.join(folder_path, file_name)
with open(file_path, 'rb') as file:
# 创建PDF阅读器对象
reader = PdfReader(file)
# 获取PDF文件的页数
# num_pages = reader.getNumPages()
num_pages = len(reader.pages)
# 将文件名称、页码数量和备注添加到列表中
# pdf_page_info.append((os.path.splitext(file_name)[0], file_name, num_pages, ''))
pdf_page_info.append((index+1, file_name, num_pages, ''))
# 创建Excel文件并输出数据
df = pd.DataFrame(pdf_page_info, columns=['编号', '文件名称', '页码数量', '备注'])
df.to_excel('output.xlsx', index=False)
Python小工具之读取文件夹下pdf文件及获取pdf页数
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 一、前言: 我们在项目中有时候会遇到要用代码或drawable下面的图片资源,我们就可以使用以下方法获取: 1、 ...
- 任务:一个文件夹下不时的会有图片传过来, 定时获取这个文件夹下最新的一张 .jpg 文件. 并将这个文件夹的全部文...