用 matplotlib 绘制图表,默认设置下,是无法在图中正确显示中文的。原因无非两种,一种是字符编码不正确,一种是字体不支持中文。前一种情况总是发生在 Python 2 用户身上,解决方法是把字符转成 UTF-8。而 Python 3 统一使用 Unicode,不存在这个问题。
本文主要解决的是第二种问题:字体不支持中文。
背景知识
想快速解决问题可直接跳到步骤一,有不明白的地方再来阅读背景知识。
matplotlib 从配置文件 matplotlibrc
中读取配置,字体相关内容也在其中。matplotlib 依次在以下四个位置寻找配置文件:
- 当前工作目录下的
matplotlibrc
。 -
$MATPLOTLIBRC/matplotlibrc
。 - 用户家目录下的
matplotlibrc
。 如 Linux 一般在~/.config/matplotlib/matplotlibrc
, macOS 在~/.matplotlib/matplotlibrc
。 -
INSTALL/matplotlib/mpl-data/matplotlibrc
,其中INSTALL
指具体的安装目录。
详见官方文档。查询当前使用的 matplotlibrc
所在目录,可以用 get_configdir()
函数:
import matplotlib
matplotlib.get_configdir()
这里有一份配置文件示例可供下载。
阅读配置文件可以发现,matplotlib 默认使用的 font.family
是 sans-serif
,即无衬线字体,而无衬线字体又是从这几种字体中依次选用:
font.sans-serif : Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
全是西文字体,没一个支持中文的。而且 matplotlib 对字体文件的格式也很挑剔,除了 .ttf
其他一概不认。比如 macOS Sierra 中的 Lucida Grande 是 .ttc
格式,即便按照顺位轮到它了,仍然会被跳过。
查询当前的 font.family
:
matplotlib.font_manager.FontProperties().get_family()
查询当前使用字体:
from matplotlib.font_manager import findfont, FontProperties
findfont(FontProperties(family=FontProperties().get_family()))
铺垫结束,我们利用上面的知识解决问题。
步骤一
Python 2 用户请先确认字符编码为 UTF-8。Python 3 用户直接跳过此步骤。
步骤二
寻找支持中文并且安装为 .ttf
格式的字体。
Windows 用户应该总能找到 SimHei.ttf
。*nix 用户可以通过 fc-list
命令或者图形工具在当前系统内查询。如果不幸真没找到符合条件的,你就得自己去下载一个或者进行格式转换了。SimHei.ttf
应该很容易找到,然而其实是未获授权的。文泉驿微米黑是一种自由字体,推荐使用。
.ttc
转换为 .ttf
,网上有不少在线或线下工具,可以自行搜索。
友情提示一句,请选择各种黑体作为图表中的字体,宋体放在图表中,丑死了。
步骤三
新安装的字体 matplotlib 一时不能找到,需要更新字体列表缓存。
如果你建立了 ~/.matplotlib/
目录的话,应该会在其中找到 fontList.py3k.cache
。在其中找到 Vera.ttf
的安装目录,把新安装的字体复制到该目录下。
删除 fontList.py3k.cache
。matplotlib 下次启动时会重建缓存,新字体随之被添加。
步骤四
现在就要在程序中使用中文字体了。
首先,你得知道字体的英文名称,比如 SimHei.ttf
就叫 SimHei,文泉驿微米黑叫 WenQuanYi Micro Hei。
然后,你有两种方法告诉 matplotlib 使用这些字体:
- 在
matplotlibrc
中,添加像这样的一行:
font.sans-serif : WenQuanYi Micro Hei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
把中文字体作为第一顺序选用的字体。
- 在程序文件开头,指定字体:
import matplotlib
matplotlib.rcParams['font.sans-serif'] = 'WenQuanYi Micro Hei'
第2种方法很灵活,可以针对每个文件单独设置。如果使用第1种方法,建议把 matplotlibrc
放在当前工作目录下,不要作为全局配置。
好了,配置完成,效果如图: