项目简介
该软件是根据企业信息汇总网站企查查中提供的数据源进行爬取的爬虫软件,采用Python语言实现,并配合依赖库 Requests负责HTTP请求等处理、BeautifulSoup负责网站页面DOM\CSS分析、xlrd和xlwt负责数据的读取与写入。
技术方案
Python、Requests、BeautifulSoup、xlrd、xlwt
实现难点
网站流程分析、网页元素样式分析
该软件是根据企业信息汇总网站企查查中提供的数据源进行爬取的爬虫软件,采用Python语言实现,并配合依赖库 Requests负责HTTP请求等处理、BeautifulSoup负责网站页面DOM\CSS分析、xlrd和xlwt负责数据的读取与写入。
Python、Requests、BeautifulSoup、xlrd、xlwt
网站流程分析、网页元素样式分析