Pandas 无法显示中文问题 解决方案
Pandas在绘图时,会显示中文为方块,主要原因有二: matplotlib 字体问题seaborn 字体问题
(实际上,matplotlib是支持unicode编码的,中文乱码得主要问题是没有找到合适的中文字体,在matplotlib的配置文件中,可以看到字体的默认设置如下:
#font.family : sans-serif
#font.sans-serif : Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
并没有中文字体,所以我们只要手动添加中文字体的名称就可以了,不过并不是添加我们熟悉的“宋体”或“黑体”这类的名称,而是要添加字体管理器识别出的字体名称,matplotlib自身实现的字体管理器在文件font_manager.py中,自动生成的可用字体信息在保存在文件fontList.cache里,可以搜索这个文件查看对应字体的名称,例如simhei.ttf对应的名称为’SimHei’,simkai.ttf对应的名称为’KaiTi_GB2312’等。因此我们只要把这些名称添加到配置文件中去就可以让matplotlib显示中文,修改的方法有两种:)
一. 直接修改配置文件matplotlibrc:
1.在配置文件中找到font.sans-serif的设置,然后添加需要的中文字体名称,例如:
font.sans-serif : SimHei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
例如:mpl.rcParams['font.sans-serif'] = ['SimHei']
2.但是如果我们横坐标有负半轴得值,‘-'值得话,我们得符号会不见,很明显,这不是程序的错误,而是由于更改了字体导致显示不出负号,
在配置文件中我们可以在axes相关设置里找到如下设置:
#axes.unicode_minus : True
可见默认情况下采用的是unicode的minus,看来我们选择的字体对这点支持不够,所以只要把它设置为False就可以了
例如:mpl.rcParams['axes.unicode_minus'] = False
import matplotlib as mpl mpl.rcParams['font.sans-serif'] = ['KaiTi'] mpl.rcParams['font.serif'] = ['KaiTi'] # mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题,或者转换负号为字符串 import seaborn as sns sns.set_style("darkgrid",{"font.sans-serif":['KaiTi', 'Arial']}) #这是方便seaborn绘图得时候得字体设置
运行效果展示:
matplotlib 解决方案一 动态修改配置:
代码和第一部分的前半部分一致
import matplotlib as mpl mpl.rcParams['font.sans-serif'] = ['KaiTi'] mpl.rcParams['font.serif'] = ['KaiTi'] # mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题,或者转换负号为字符串
matplotlib 解决方案二 设置自定义字体:
import numpy as np import pylab as pl import matplotlib.font_manager as fm myfont = fm.FontProperties(fname=r'D:Fontssimkai.ttf') # 设置字体 t = np.arange(0.0,2.0 * np.pi,0.01) # 自变量取值范围 s = np.sin(t) # 计算正弦函数值 z = np.cos(t) # 计算余弦函数值 pl.plot(t,s,label='正弦') pl.plot(t,z,label='余弦') pl.xlabel('x-变量',fontproperties=myfont,fontsize=24) #设置标签 pl.ylabel('y-正弦余弦函数值',fontproperties=myfont,fontsize=24) pl.title('sin-cos函数图像',fontproperties=myfont,fontsize=32) #图像标题 pl.legend(prop=myfont) pl.show()
运行结果展示:
win自带字体库路径
- C:WindowsFonts 内含大量字体
- 注意在该文件夹下,字体文件的名字和其他文件夹下显示的不一致,请使用右键属性-常规中文件名,或者使用拷贝到其他文件夹后显示的字体文件名字
参考
- Matplotlib输出中文显示问题,内含mac操作系统字体库https://my.oschina.net/u/1180306/blog/279818
- github的帖子,pandas无法显示中文的问题https://github.com/mwaskom/seaborn/issues/1009