Go从单机爬虫到分布式爬虫 - 专题 - 简书

投稿

Go从单机爬虫到分布式爬虫

收录了5篇文章 · 8人关注

正则表达式
现在网页的源代码我们都已经拿到了，但是我们要怎么解析它获取有价值的信息呢？使用css选择器使用xpath 使用正则表达式，我们这里就使用它了...

__apple 0 1
提取城市和url
我们介绍完正则表达式以后，再次进入到我们的爬虫项目。我们现在是获取了城市列表的网页源码我们来写一个解析城市列表的函数printCityList ...

0.1 __apple 0 1

获取初始页面的内容
我们之前说过了，我们先从单任务版开始进行。。。。。这里我们先给单任务版爬虫定一个小目标获取并打印所在城市第一页用户的详细信息我们首先给这个项...

__apple 0 1
总体算法
我们可以先不用着急，我们先来看看人工怎么去获取，那么我们针对珍爱网我们应该怎么发现用户呢？通过城市列表->城市->下一页->用户用过用户->...

__apple 0 0
爬虫项目的介绍
这个篇幅呢我们打算用Go做一个实战的项目，我们选择的是一个分布式的网络爬虫但是这个只是一个比较小型的爬虫，我们要爬的是一个相亲网站，希望你学完这...

__apple 0 0

专题公告

这是一个Go语言初学者到进阶开发非常友好的系列文章，相信每一节都是用心写的。