写在前面:帮助一位朋友解决一个自动化相关问题,记录下来,希望能帮助到正在遇到此类问题的你提供思路,需求描述:
将左侧 txt 文本数据自动生成 excel表格。txt规律是空行分隔的每组数据,左边一列是 key ,也就是 excel 的标题 ,右边是值。所以这里重点就是根据对应的key写入对应的值。如果大家有什么好想法,欢迎留言,一起交流学习 ~
实现思路:
①将txt数据划分成两列,整理数据格式【规范成只有key 和 value】
②将txt按照空值上下划分数据,对每组数据写入excel里的一行中
一、读取原始 txt 数据
import pandas as pd
import numpy as np
txt_data = pd.read_table('test.txt')
txt_data
二、数据处理:一列数据变两列
def process(df):
title = df.str.split()[0][0]
content = df.str.split()[0][-1]
if content == 'disable':
title = '是否启用'
if title == 'exit':
title = np.nan
content = np.nan
return title,content
txt_data[['title','con']] = txt_data.apply(process,axis=1,result_type='expand')
txt_data[['title','con']].head(20)
三、按照title值为nan为条件,切分数据,通过找开始和结束索引将每组数据分块,将每组数据写入excel
lis = txt_data[txt_data['title'].isnull()==True].index.tolist()
lis.insert(0,-1)
for i, each in enumerate(range(1,len(lis))):
end=each
start=i
start_v = lis[start]+1
end_v = lis[end]
print(start_v,end_v)
data_write_excel(start_v,end_v)
print('写入成功!')
四、根据指定【行索引,列索引】位置写入每组数据,并自动匹配标题
# 结果表的标题模板
ds = pd.read_excel('res.xlsx')
ds.index = ds['rule']
def data_write_excel(start_v,end_v):
df = txt_data[['title','con']][start_v:end_v]
inx = df['con'][start_v]
print(inx)
li = []
for i,j in df.T.items():
z = 1
if j['title'] in li:
z += 1
li.append(j['title'])
ds.loc[inx,j['title']+'_'+str(z)]=j['con']
else:
li.append(j['title'])
ds.loc[inx,j['title']]=j['con']
ds.to_excel('res.xlsx')
五、实现效果
完 ~ 如果觉得对你有帮助欢迎点赞 ~