一次Jenkins+Python的中文乱码趟坑

环境

  • Windows
  • Jenkins(Pipeline+bat)
  • Python 3.6(后面简写Py)
  • Unity

下面的过程分析比较凌乱,可以直接到最后看结论


问题点

  1. Python调用Unity打包,传递的中文名乱码
  2. Jenkins中Console Output里中文显示乱码
    • Jenkins自己的输出乱码
    • Jenkins输出的Py Log乱码
    • Py中的Log文件乱码

问题现象

Jenkins乱码
Python Log乱码
Jenkins bat encoding=utf8

过程

  发现问题,我第一时间找度娘,发现好多人在写这个问题,给了一大堆方案,基本都是配置环境的。配置项有LANG、JAVA_TOOL_OPTIONS、PYTHONIOENCODING等等;配置的位置有人说在Jenkins的Global Environment variables,有人说要配到系统的环境变量里,也有人说要改jenkins.xml。
  上面这些方法我都试了,均无效!!当然有博主自己写说生效了,可能环境上还是有未知的差异吧。没有大腿可抱的情况下,只能自己蒙了。

1、分析乱码原因

  出现乱码肯定是编码不对,但究竟是怎么不对的,要搞清楚正确的(文字实际用的编码)是什么,错误的(显示时使用的编码)是什么。可观测到现象有下面几个:

    1. Jenkins中显示bat调用命令里的中文就是乱码
    1. Py UTF8的Log也是乱码,且跟上面显示的乱码内容一致
    1. Jenkins中bat指定encoding=utf8后,Jenkins自身的Log正常显示中文;而其显示的Py Log还是乱码,并且乱码变了

  从1、3推断,Jenkins默认显示用的编码是GBK,文字自身的编码是UTF8。但这跟2的现象似乎是冲突的,因为Log文件本身是UTF8编码,而其显示的出来的也是乱码,且跟Jenkins的一致。
  这时候做个简单的实验来验证结论。用Notepad++建一个UTF8的文件,里面写上“中文”俩字,然后用ANSI编码去看。

UTF8编码的“中文”
显示为ANSI(GBK)的“中文”

  实验证实了上面推断的正确性,那么Log里的乱码又是为什么呢?在上面的Log里展示了原因,Py中stdio的编码为cp936(也就是GBK)。这个情况是,Jenkins将UTF8的命令行传给了Py,然后Py用GBK解析,并转码为内部的UTF8,最后用UTF8输出Log。

2、解决问题

  原因找到了,接下来就是解决问题。既然外部配置都无效,只能在Py内部处理了。我第一反应是,错误的编码在里面逆向纠正就好了。
  我尝试的方案是处理sys.argv里记录的内容:

  1. 将错误的UTF8 str,用GBK encode为bytes
  2. 然后再将bytes,用UTF8 decode为str

  我先用“Pok2盟友”做测试,发现问题解决了。欣喜的跑上面“中文”,结果直接报错程序挂了Orz...,我还天真的以为是Py检查严格给了报错,让它跳过检查就好了。于是加了errors="ignore"参数,忽略报错,decode完输出空白了,结果啥也不是。
  仔细想想,不匹配的转码其实是“有损的”,因为两种编码使用的字节数不同。“中文”用GBK是4bytes,UTF8是6Bytes。忽略报错后,Py应该会把无法解码的byte直接丢弃。UTF8=》GBK丢失一部分内容;GBK=》UTF8又丢弃一些,最后直接丢没了。
  到这里我主观上能想到的解决方案已经没了,走投无路!!!
  在我麻木的Google过程中,鬼使神差般又去尝试了一下chcp,结果成功了!!!真的成功了,一切问题都得到解决!!!
  chcp在很早之前就尝试过,当时写法是

bat "chcp 65001 & ClientDist xxx"

这次想尝试分两行写,然后就成了~

bat '''chcp 65001
ClientDist xxx'''

各问题解决方案总结

  上面过程描述其实不完整(中间尝试了各种方向,细节实在太多),甚至还有些凌乱,所以最后,清晰的总结下:

1、Jenkins Console Output显示bat命令乱码

调用bat的时候添加encoding参数

bat encoding: 'utf8', script: '调用指令'
2、Jenkins Console Output显示Python Log乱码

Python里将stdout、stderr的编码改成UTF-8
这里补充一点:Jenkins bat调用Python的时候stdin、stdout、stderr的编码都是cp936

sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
sys.stderr = io.TextIOWrapper(sys.stderr.buffer, encoding='utf-8')
3、Jenkins bat传递给Python的中文参数乱码

调用bat的时候,用chcp修改命令行编码。一定要分行写!!!
注意,下面是 3个单引号 的字符串

bat '''chcp 65001
调用指令'''

做完上面的处理,应该所以内容都处于UTF8的状态下。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容