import re
p = re.compile(r'\d+')
print p.split('one1two2three3four4')
import re
re_han = re.compile(ur"([\u4E00-\u9FA5]+)")
sentence="工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作"
blocks = re_han.split(sentence)
这里有一个特点:
如果r的""内加()的话,它会把所有的内容都分出来,如['one', '1', 'two', '2', 'three', '3', 'four', '4', '']
如果r的""内不加()的话,它会以指定的类型作为分割,并不包含指定的类型。如['one', 'two', 'three', 'four', '']