python+requests+pandas实现数据对比,输出excel指定模板结果数据

教程介绍:

该教程主要校验思路是根据news_id获取新闻和新闻主题数据,调用接口获取企业数据(实际结果)
根据news_id获取csv中符合条件的数据,获取企业数据(预期结果),两者比较,输出不相等的数据(excel输出,日志输出)

注意! 公司项目不同,仅供参考,重在思路理解

执行脚本 test_match_company.py

# -*- coding: utf-8 -*-

import os, pytest, json
import pandas as pd
from jsonpath import jsonpath
import requests
from util.data.xlwt_tool import write_excel
from util.report.logger_tool import Logger


class TestMatchCompany():
    real_path = os.path.split(os.path.realpath(__file__))[0]
    news_path = real_path + os.sep + "../data/news_content.txt"
    news = pd.read_csv(news_path, sep='^')
    news1 = news.values.tolist()

    def setup_class(self):
        algo_name = "match_company"
        # host = "IP地址"
        host = "ip地址"
        port = "端口号"
        # match_company_url
        self.url = "http://" + host + ':' + str(port) + '/algorithm/process/' + algo_name
        real_path = os.path.split(os.path.realpath(__file__))[0]
        labels_path = real_path + os.sep + "../data/news_company_label.csv"
        self.labels_expected = pd.read_csv(labels_path, sep=';')
        # self.baseline_cols = ['chinesename','emotionindicator','stockcode']
        self.baseline_cols = ['stockcode', 'companyid']
        self.logging = Logger('../logs/{}.log'.format(algo_name), level='error')
        # self.logging = Logger('../logs/{}.log'.format(algo_name), level='info')

    def test_company_labels(self):
        excel_data_list = []
        for i in self.news1:
            # news_id = str(i[0])
            news_id = i[0]
            title = i[1]
            content = i[2]
            # 获取match_company算法接口的结果数据
            parameter1 = {'title': title, 'content': content, 'extr_method': 1,
                          'use_skip': 0}  # extr_method默认值为0,需要设为1调用,且没有计划修改默认值
            payload1 = {'parameter': json.dumps(parameter1, ensure_ascii=False)}
            response1 = requests.post(self.url, data=payload1).json()
            json_data = jsonpath(response1,"$..com")
            shijijieguo = []
            for i in json_data[0]:
                code = jsonpath(i,"$..code")
                comcode = jsonpath(i,"$..comcode")
                shijijieguo.append([code[0],comcode[0]])
            shijijieguo.sort()

            # 根据news_id获取csv文件中符合条件的数据
            expected = self.labels_expected
            baseline_result = expected[expected['newsid'] == news_id][self.baseline_cols]
            data_expect = baseline_result.values.tolist()
            for i in range(len(data_expect)):
                if data_expect[i][0] == 'csf':
                    data_expect[i][0] = ''
            data_expect.sort()

            # 判断各种异常情况
            if data_expect == [] and shijijieguo == []:
                # excel_data_list.append(["csv和接口都没查到:"+str(news_id), str(data_expect), str(shijijieguo)])
                self.logging.debug(
                    "接口和csv文件都没有查到企业新闻数据,不做对比 news_id:{} 预期结果为空:{} 接口实际结果为空:{}".format(news_id, data_expect, shijijieguo))

            elif data_expect == [] and shijijieguo != []:
                excel_data_list.append([str(news_id), str(data_expect), str(shijijieguo)])
                self.logging.error("对比不一致 news_id:{} 预期结果为空:{} 接口实际结果不为空:{}".format(news_id, data_expect, shijijieguo))

            elif data_expect != [] and shijijieguo == []:
                excel_data_list.append([str(news_id), str(data_expect), str(shijijieguo)])
                self.logging.error("对比不一致 news_id:{} 预期结果为空:{} 接口实际结果不为空:{}".format(news_id, data_expect, shijijieguo))

            elif data_expect != [] and shijijieguo != []:
                if data_expect != shijijieguo:
                    excel_data_list.append([str(news_id), str(data_expect), str(shijijieguo)])
                    self.logging.error("对比不一致 news_id:{} 预期结果:{} 实际结果:{}".format(news_id, data_expect, shijijieguo))
                else:
                    # excel_data_list.append(["一致:"+str(news_id), str(data_expect), str(shijijieguo)])
                    self.logging.info("对比一致 news_id:{} 预期结果:{} 实际结果:{}".format(news_id, data_expect, shijijieguo))
        # 将日志输出到excel
        write_excel("../logs/match_company_error_{}.xls".format(len(excel_data_list)), ['news_id', '预期结果', '实际结果'], excel_data_list)

结果输出工具 write_excel.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author : Leiyh
# @File : pandas_tool.py
import xlwt


def write_excel(file_name,data_title,data_list,encoding='utf-8'):
    '''

    :param file_name: 文件路径地址
    :param data_title: excel第一行的标题栏
    :param data_list: 二维数据列表
    :param encoding:
    :return:
    '''
    # 创建workbook和sheet对象 注意Workbook的开头W要大写
    workbook = xlwt.Workbook(encoding=encoding)
    # 添加一个名为sheet1的表
    sheet1 = workbook.add_sheet('sheet1', cell_overwrite_ok=True)

    # 向表头写入数据
    for i in range(len(data_title)):
        sheet1.write(0, i, str(data_title[i]))

    # 向sheet写入数据
    for i in range(len(data_list)):
        for j in range(len(data_title)):
            sheet1.write(i + 1, j, str(data_list[i][j]))

    # 保存数据到‘Workbook2.xls’文件中
    workbook.save(file_name)
    print('创建execel完成!')

if __name__ == '__main__':
    # data = get_test_case("C:/softwareData/PycharmProjects/s00-wuling/documents/user/注册接口sign_up.xlsx")
    # print(data[0])
    # print(data[1])
    # write_excel("match_company.xls", ['news_id', '预期结果', '实际结果'],
    #             [['35942860', str(['', 'ICN5025197980', 1]), str(['', 'ICN5025197980', 1])]])
    write_excel("match_company.xls", ['news_id', '预期结果', '实际结果'],
                [['35942860', "['', 'ICN5025197980', 1]", "['', 'ICN5025197980', 1]"]])


日志输出工具 logger_tool.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author : Leiyh
# @File : logger_tool.py
import logging


class Logger(object):
    level_relations = {
        'notset':logging.NOTSET,
        'debug': logging.DEBUG,
        'info': logging.INFO,
        'warning': logging.WARNING,
        'error': logging.ERROR,
        'crit': logging.CRITICAL
    }

    def __init__(self, filename, filemode='w', level='notset',
                 format='%(asctime)s - %(levelname)s: %(message)s'):
        logger = logging.getLogger()
        logger.setLevel(level=self.level_relations.get(level))
        filehandle = logging.FileHandler(filename,filemode)
        formatter = logging.Formatter(format)
        filehandle.setFormatter(formatter)
        logger.addHandler(filehandle)


    def debug(self, msg):
        logging.debug(msg)

    def info(self, msg):
        logging.info(msg)

    def warning(self, msg):
        logging.warning(msg)

    def error(self, msg):
        logging.error(msg)

    def critical(self, msg):
        logging.critical(msg)


if __name__ == '__main__':
    logger = Logger('all.log', level='info')
    logger.info("Start print log")
    logger.debug("Do something")
    logger.warning("Something maybe fail")
    logger.error("error print log")
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容