前置知识和要求:
- Python基本语法,程序逻辑基础完成
- 了解HTML
- 正则表达式
推荐视频:Python开发简单爬虫
视频介绍了完整的爬虫流程:URL管理,网页下载,页面解析。
正则表达式30分钟入门教程 (这篇内容比较多,全面)
010 - 使用BeautifulSoup和XPath抓取结构化数据
正则表达式在线测试工具:http://tool.oschina.net/regex/
开始你的第一个爬虫程序~
前置知识和要求:
推荐视频:Python开发简单爬虫
视频介绍了完整的爬虫流程:URL管理,网页下载,页面解析。
正则表达式30分钟入门教程 (这篇内容比较多,全面)
010 - 使用BeautifulSoup和XPath抓取结构化数据
正则表达式在线测试工具:http://tool.oschina.net/regex/
开始你的第一个爬虫程序~