- 1 写文件
f = open('text.txt', 'wr')
f.write("hi ok")
- 2 按行读取
f = open('test.txt', 'r')
while 1:
line = f.readline().strip('\n')
if not line:
break
pass
print line
pass
.strip('\n')为去除末尾的回车行
.strip()为去除首尾的空格 Python真是🐂 太方便了 我去
- 3 去除换行符
line = line.replace('\n', '')
- 4 字符串分割
b = a.split(',')
print b
- 5 延迟爬取
import time
time.sleep(1)
- 6 清理HTML标签,剩下一行一行的文本
[script.extract() for script in soup.findAll('script')]
[style.extract() for style in soup.findAll('style')]
reg1 = re.compile("<[^>]*>")
content = reg1.sub('',soup.prettify())
相当于soup.get_text()
- 8 生成随机字符串
import random
import string
print ''.join(random.sample(string.hexdigits, 8))
- 9 截取字符串
print str[0:3]
- 10 python for循环
for num in range(0,10):
print num
- 11 mac安装库
pip install selenium
12 python函数内要用全局变量的话需要加globla跟php一样的。
global globvar