6篇文章 · 5845字 · 2人关注
BeautifulSoup 解析库 BeautifulSoup 解析库根据HTML和XML语法建立解析树,进而高效解析其中的内容。 注:这里所说...
XPath XPath,全称XML Path Language,即XML路径语言,它提供简洁明了的路径选择表达式,用于在 XML 文档中通过元素...
requests 请求库 requests库建立在urllib库的基础上,是一个处理HTTP请求的第三方库,最大的优点是程序编写的过程更接近正常...
urllib 请求库 urllib是Python内置的HTTP请求库,包含request、error、parse、robotpaser这4个模块...
爬虫基础 HTTP基本原理 URI和URL URI(Uniform Resource Identifer):统一资源标识符 URL(Unifor...
正则表达式 正则表达式是一个特殊的字符序列,用于检查字符串是否与某种模式匹配 正则表达式测试工具 常用匹配规则 常用正则表达式 匹配中文字符 匹...
文集作者