python大大的图
作业图
1、urllib
urllib模块提供的上层接口,使我们可以像读取本地文件一样读取www和ftp上的数据。
2、re
re模块为高级字符串处理提供了正则表达式工具。对于复杂的匹配和处理,正则表达式提供了简洁、优化的解决方案。
python大大的解答:
其实这用re是过滤网页html符号,只显示我们关注的文字。
3、ulretrieve
直接将远程数据下载到本地。
4、re.sub()
re是regular expression的所写,表示正则表达式。sub是substitute的所写,表示替换;re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能。
5、非贪婪模式
“*?”的组合是非贪婪模式。贪婪模式,总是尝试匹配尽可能多的字符; 非贪婪模式则相反,总是尝试匹配尽可能少的字符。
6、join()
连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串。