目录
- 写在前面
- 如何使用该指北
- 写作目的
1. 写在前面
如果只是需要完成一个常规的任务,请首先考虑使用成熟的【爬虫】软件,而不是自己写代码。 例如:八抓鱼采集器。其他请参考知乎-有免费的爬虫软件使用吗? 我使用过GooSeeker做简单的爬虫任务,还不错~
写【爬虫】代码意味着有特殊需求,而且该需求无法使用常规【爬虫】软件完成。一般而言,如果需要收集的数据可以在3小时内纯手工完成,那么这意味着不推荐使用【爬虫】进行任务。
目前这些教程都基于Mac系统-Python语言,Windows系统教程我目前还没有精力去完成(其实我有好久没用Windows系统工作了...哈哈哈哈我并不想在上面编程)。R和Java也可以写爬虫,不过我不会也不打算学。
2. 如何使用该指北
先阅读分析需求,确定目前需求是否需要借助爬虫,
再尝试安装所需软件(如果下定决心了)
继而尝试建立第一个最简单的爬虫
最后开始拓展自己的爬虫。
可以根据自己具体的情况找一些实际案例的网络教程,知乎/简书/CDSN上都有很多
3. 写作目的
希望我的朋友们能充分使用数据来助力自己的事业,享受数据为我们带来的好处。同时也为了使我的朋友们能够专注于自己的优势,尽可能地在辅助工作(比如说数据收集)方面减少时间花费。
同时,这也是Arthur与我将知识框架落地的一个尝试,后续还有其他教程,包括并不限于:
- Docker 虚拟机的另一种存在
- Python-Flask 轻量级Web框架
- R 统计工作的利器
- R ggplot2 / Python Matplotlib 科研/程序员风格的可视化图表工具
另外,这里没有无偿的信息收集代劳。
“在吗”
“在”
“能帮我收集一下这些数据吗,感觉你很了解爬虫,这对你来说应该很简单的,谢谢了”
“你上一句是什么?”
“在吗”
“不在”