近几年,国内的采集产品发展得如火如荼,比如八爪鱼、火车头,很多人用采集软件实现SEO内容抓取,社交网络舆情分析,电商网站商品详情采集竞价分析等。但国内在大数据采集行业起步得比较晚,国外已经发展了十几年,比较成熟。因此,下面将介绍五个采集相关的国外专业博客网站给大家。
Scraping.pro是一个专业的采集软件测评网站,上面有各种国外比较顶尖的采集软件测评文,比如scrapy、octoparse等,从操作界面、功能点(登陆采集、翻页、搜索查询采集、验证码采集等)、价格到客服等,都有很详细的介绍。一旦这些软件有更新,scraping.pro也会马上更新。此外,该网站也会有不同软件的对比文,可以让用户对这些软件有更直观的印象,更好挑选一款最适合的软件。
相比scraping.pro,Kdnuggets涵盖范围更广,包括商业分析、大数据、数据挖掘、数据科学等。它有几大栏目:Kdnuggets新闻、软件、工作、课程、数据和教育,有关于数据挖掘、网站采集的最新新闻以及从1993年以来关于数据挖掘的知识。它有时还会组织一些交流会供专家和读者们交流。
Octoparse是一款功能强大的免费采集软件,它的博客提供的内容比较广,从网站采集的具体应用到人工智能、语义分析、大数据行业都有涉及,内容比较浅显易懂,比较适合初步的网站采集用户。该平台最大的亮点是它有各种比较专业的对比文和盘点文,将上下游企业的软件都囊括了进来,不用再费心找其它的软件,比如Top 30 Big Data Tools for Data Analysis。
Big data news和Kdnuggets类似,涵盖的范围主要是在大数据行业方面,网站采集是其下面的一个子栏目。Big data news严格来说有点像社区,上面的内容都是用户自己上传的,编辑只负责审核,因此内容也会比较多样。如果你想成为一个数据专家,或者想跟这些专家多交流,这个网站是一个不错的选择,只要注册一个账号就可以了。
跟Big data news类似,Analytics Vidhya是一个更专业的数据采集网站,内容涵盖数据科学、机器学习、网站采集等。除了日常订阅上面的内容外,你还可以在它的论坛上问问题,是一个很好的学习和交流平台。
以上简单的介绍了五个博客网站的特点,如果想要了解更多,可以随时关注Octoparse的博客,上面经常会有关于这方面的信息。