最近在试图爬一个编码为GBK的网页,始终得到的都是乱码,各种encode和decode都不行,后来在网上搜索了一下,终于找到了解决方法,记在这里备用。
如果s是一个GBK编码字符,使用如下办法可以转换成UTF8.
s.encode('latin-1').decode('gbk').encode('utf-8')
最近在试图爬一个编码为GBK的网页,始终得到的都是乱码,各种encode和decode都不行,后来在网上搜索了一下,终于找到了解决方法,记在这里备用。
如果s是一个GBK编码字符,使用如下办法可以转换成UTF8.
s.encode('latin-1').decode('gbk').encode('utf-8')