之前就跟大家介绍过,robots禁止抓取的网站的数据其实大部分是搜索引擎不能抓取的,如果我们能利用起来,那就是非常好的原创数据。
大家可以再回去看一下我之前的文章:李亚涛:做seo优化要善于发现原创数据
文章中有介绍利用评论数据来作为原创文章素材
大家知道SEO优化重在实战,针对评论数据这个点,我专门写了一个程序,来抓取某购物网站的评论数据(此网站robots也是禁止百度抓取的),虽然程序不算完善,但总算完成了。
程序运行截图如下:
采集的评论数据我放到文本文件里打开有1000多行,这些数据可以直接作为文章内容
采集的页面商品的标题是:新宝来POLO明锐朗逸行速腾晶锐途安高尔夫机滤博世机油滤芯格清器
我直接可以用这个来作为标题,或者后面再加上评论2个字,然后以抓取到的评论数据作为内容,这就是一个纯原创的文章。
好了,今天就分享到这里
我是李亚涛,每天更新一篇原创文章,有1人看了有收获我就会非常开心!