zy小太阳 - 简书

发简信

zy小太阳

6
关注
9
粉丝
61
文章
53268

字数
8

收获喜欢
1

总资产

IP属地：江苏

zy小太阳

购票软件竞品分析报告（淘票票测试项目）
一．行业分析（市场现状，代表性产品，产品市场占比）随着人们生活水平和收入的提高，越来越多的人选择去电影院看电影，为了身心放松，为了联络感情，为了潮流，为了追星或追剧，为了3...

4018 0 0
zy小太阳

淘票票产品需求说明书（测试项目）
目录一、简介 1 用户首次登陆 1 二、产品功能结构 2 三、产品需求 3 四、产品功能流程 4 五、产品特性 6 购票功能模块 7 六、其他产品需求...

2566 0 0

zy小太阳

凤华正茂
写了 58659 字，被 1406 人关注，获得了 2669 个喜欢
zy小太阳

中国曲谱网爬虫项目接口文档
接口功能获取制定项目的分类信息 URL http://www.qupu123.com/ 支持格式 JSON HTTP请求方式 GET 返回字段接口示例地址：http:/...

579 0 0
zy小太阳

pyspider
pyspider是一个爬虫架构的开源化实现主要的功能需求是：抓取、更新调度多站点的特定的页面需要对页面进行结构化信息提取灵活可扩展，稳定可监控而这也是绝大多数pyt...

328 0 0
zy小太阳

scrapy爬虫的部署
以下厨房为例： pip3 install scrapyd(服务) pip3 install scrapyd-client(打包) scrapyd-deploy -p ...

215 0 0
zy小太阳

CrawlSpider的使用
CrawlSpider是爬取那些具有一定规则网站的常用的爬虫，它基于Spider并有一些独特属性 rules: 是Rule对象的集合，用于匹配目标网站并排除干扰 parse_...

4451 0 3

zy小太阳

Scrapy_Redis Settings.py设置文件
项目名称爬虫存储的文件路径创建爬虫文件的模版,创建号的爬虫文件会存放在这个目录下设置ua,来模拟浏览器请求设置是否需要准守robot协议:默认为True 设置请求的最...

540 0 0
zy小太阳

Scrapy_Redis分布式爬虫
pip3 install scrapy-redis Scrapy-redis提供了四种组件（components）： (四种组件意味着这四个模块都要做相应的修改) Sched...

924 0 0
zy小太阳

实现通用爬虫、常见反爬措施、下载中间键
实现通用爬虫创建爬虫文件的方式scrapy genspider -t crawl 爬虫文件域爬虫文件继承的类CrawlSpider rules ：里面存放的是Rule...

568 0 0
zy小太阳

Redis 简介、练习
Redis Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。从2010年3月15日起...

486 0 0
zy小太阳

Scrapy框架（下载项目图片以及实现爬虫数据持久化保存）scrapy shell
安装 Scrapy 框架 pip3 install Scrapy Scrapy架构图(绿线是数据流向)： Scrapy Engine(引擎): 负责Spider、ItemPi...

1109 0 0

zy小太阳

python与MongoDB交互
eg：

181 0 0
zy小太阳

MongoDB
启动：sudo service mongod |mongodb start停止：sudo service mongod |mongodb stop重启：sudo ser...

261 0 0
zy小太阳

进程、进程和线程对比功能
进程什么是进程程序：例如xxx.py这是程序，是一个静态的进程：一个程序运行起来后，代码+用到的资源称之为进程，它是操作系统分配资源的基本单元，不仅可以通过线程完成多任...

283 0 0
zy小太阳

协程、Seleniium
协程：协程拥有自己的CPU寄存器上下文，所占用的资源非常少，当我们在携程中遇到耗时操作时，我们会从一个携程切换到另一个协程，这时会把相关数据保存在CPU寄存器上下文，当耗时操...

740 0 1
zy小太阳

beautifulsoup、pyquery
beautifulsoup 和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。 lxm...

2132 0 1

zy小太阳

re模块、xpath
re模块的高级用法 search: search 方法用于查找字符串的任何位置，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果，它的一般使用形式如下...

484 0 0
zy小太阳

多线程
多线程爬虫 1、创建一个任务队列：存放待爬取的url地址2、创建爬取线程发起请求，执行任务下载3、创建数据队列：存放爬取线程获取的页面源码4、创建解析线程：解析H...

232 0 0

暂无个人介绍