re模块
re:正则表达式
作用:对字符串进行过滤,找到你所关心的内容
注意:re模块的内部实现,不是python 而是调用了c库
import re
#\w与\W
print(re.findall('\w','hello egon 123'))#['h', 'e', 'l', 'l', 'o', 'e', 'g', 'o', 'n', '1', '2', '3']
print(re.findall('\W','hello egon 123'))#[' ', ' ']
#\s与\S
print(re.findall('\s','hello egon 123'))#[' ', ' ', ' ', ' ']
print(re.findall('\S','hello egon 123'))#['h', 'e', 'l', 'l', 'o', 'e', 'g', 'o', 'n', '1', '2', '3']
#\n \t都是空,都可以被\s匹配
print(re.findall('\s','hello \n egon \t 123'))#[' ', '\n', ' ', ' ', '\t', ' ']
#\n与\t
print(re.findall(r'\n','hello egon \n123'))#['\n']
print(re.findall(r'\t','hello egon\t123'))#['\t']
#\d与\D
print(re.findall('\d','hello egon 123'))#['1', '2', '3']
print(re.findall('\D','hello egon 123'))#['h', 'e', 'l', 'l', 'o', ' ', 'e', 'g', 'o', 'n', ' ']
#\A与\Z
print(re.findall('\Ahe','hello egon 123'))#['he'],\A==>^
print(re.findall('123\Z','hello egon 123'))#['he'],\Z==>$
#^与$
print(re.findall('^h','hello egon 123'))#['h']
print(re.findall('3$','hello egon 123'))#['3']
# ^与\A相同
# $与\Z相同
# 重复匹配:| . | * | ? | .* | .*? | + | {n,m} |
#.
print(re.findall('a.b','a1b'))#['a1b']
print(re.findall('a.b','a1b a*b a b aaab'))#['a1b', 'a*b', 'a b', 'aab']
print(re.findall('a.b','a\nb'))#[]
print(re.findall('a.b','a\nb',re.S))#['a\nb']
print(re.findall('a.b','a\nb',re.DOTALL))#['a\nb']同上一条意思一样
#?
print(re.findall('ab?','a'))#['a']
print(re.findall('ab?','abbb'))#['ab']#匹配所有包含小数在内的数字
print(re.findall('\d+\.?\d*',"asdfasdf123as1.13dfa12adsf1asdf3"))#['123', '1.13', '12', '1', '3']
#.*默认为贪婪匹配
print(re.findall('a.*b','a1b22222222b'))#['a1b22222222b']
#.*?为非贪婪匹配:推荐使用
print(re.findall('a.*?b','a1b22222222b'))#['a1b']
#+
print(re.findall('ab+','a'))#[]
print(re.findall('ab+','abbb'))#['abbb']
#{n,m}
print(re.findall('ab{2}','abbb'))#['abb']
print(re.findall('ab{2,4}','abbb'))#['abb']
print(re.findall('ab{1,}','abbb'))#'ab{1,}' ===> 'ab+'
print(re.findall('ab{0,}','abbb'))#'ab{0,}' ===> 'ab*'#[]
print(re.findall('a[1*-]b','a1b a*b a-b'))#[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall('a[^1*-]b','a1b a*b a-b a=b'))#[]内的^代表的意思是取反,所以结果为['a=b']
print(re.findall('a[0-9]b','a1b a*b a-b a=b'))#[]内的^代表的意思是取反,所以结果为['a=b']
print(re.findall('a[a-z]b','a1b a*b a-b a=b aeb'))#[]内的^代表的意思是取反,所以结果为['a=b']
print(re.findall('a[a-zA-Z]b','a1b a*b a-b a=b aeb aEb'))#[]内的^代表的意思是取反,所以结果为['a=b']
#():分组
print(re.findall('ab+','ababab123')) #['ab', 'ab', 'ab'] print(re.findall('(ab)+123','ababab123')) #['ab'],匹配到末尾的ab123中的ab
print(re.findall('(?:ab)+123','ababab123')) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall('href="(.*?)"',' < a href="http://www.baidu.com" > 点击< /a> '))#['href="http://www.baidu.com"']
#|
print(re.findall('compan(?:y|ies)','Too many companies have gone bankrupt, and the next one is my company'))
# ===========================re模块提供的方法介绍===========================
import re
#1
print(re.findall('e','alex make love') )#['e', 'e', 'e'],返回所有满足匹配条件的结果,放在列表里
#2
print(re.search('e','alex make love').group())#e,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。
#3
print(re.match('e','alex make love'))#None,同search,不过在字符串开始处进行匹配,完全可以用search+^代替match
#4
print(re.split('[ab]','abcd'))#['', '', 'cd'],先按'a'分割得到''和'bcd',再对''和'bcd'分别按'b'分割
#5
print('===>',re.sub('a','A','alex make love'))#===> Alex mAke love,不指定n,默认替换所有
print('===>',re.sub('a','A','alex make love',1))#===> Alex make love
print('===>',re.sub('a','A','alex make love',2))#===> Alex mAke love
print('===>',re.sub('^(\w+)(.*?\s)(\w+)(.*?\s)(\w+)(.*?)$',r'\5\2\3\4\1','alex make love'))#===> love make alex
print('===>',re.subn('a','A','alex make love'))#===> ('Alex mAke love', 2),结果带有总共替换的个数
#6
obj=re.compile('\d{2}')
print(obj.search('abc123eeee').group())#12
print(obj.findall('abc123eeee'))#['12'],重用了obj
subprocess
作用:用于执行系统命令
常用方法:
run 返回一个表示执行结果的对象
call 返回的执行的状态码
总结: subprocess的好处是可以获取指令的执行结果
subprocess执行指令时 可以在子进程中 这样避免造成主进程卡死
import subprocess
res1=subprocess.Popen(r'dir C:\Users\Administrator\PycharmProjects\test\函数备课',shell=True,stdout=subprocess.PIPE)
res=subprocess.Popen('findstr test*',shell=True,stdin=res1.stdout, stdout=subprocess.PIPE)
print(res.stdout.read().decode('gbk'))#subprocess使用当前系统默认编码,得到结果为bytes类型,在windows下需要用gbk解码
注:所有模块详情参考http://www.cnblogs.com/linhaifeng/articles/6384466.html