27篇文章 · 17680字 · 1人关注
PhantomJS PhantomJS 是一个基于Webkit的“无界面”(headless)浏览器,它会把网站加载到内存并执行页面上的 Jav...
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Se...
协程 协程,又称微线程,纤程。英文名Coroutine。 1.协程是什么? 协程是python个中另外一种实现多任务的方式,只不过比线程更小占用...
迭代器 迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭...
官方文档:http://docs.python.org/library/json.htmlJson在线解析网站:http://www.bejso...
官方文档:https://pythonhosted.org/pyquery/index.html# 中文教程:http://www.geoinf...
爬取图片并保存本地
CSS 选择器:BeautifulSoup4 官方文档:http://beautifulsoup.readthedocs.io/zh_CN/v4...
使用XPath简单爬取起点网并将数据存入MySQL数据库
文集作者