绘图和可视化 Pandas 《利用Pandas做数据分析2》摘录
信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,
- 例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。
- 另外,做一个可交互的数据可视化也许是工作的最终目标。
matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。
matplotlib支持各种操作系统上许多不同的 GUI后端,而且还能将图片导出为各种常见的矢量(vector)和光栅(raster)图。
随着时间的发展,matplotlib衍生出了多个数据可视化的工具集,它们使用 matplotlib作为底层。其中之一是seaborn。
⚠️:
虽然seaborn这样的库和pandas的内置绘图函数能够处理许多普通的绘图任务,但 如果需要自定义一些高级功能的话就必须学习matplotlib API。
matplotlib的示例库和文档是学习高级特性的最好资源。
%matplotlib notebook import matplotlib.pyplot as plt
Figure和Subplot
matplotlib的图像都位于Figure对象中。
fig = plt.figure() ax1 = fig.add_subplot(2, 2, 1) ax2 = fig.add_subplot(2, 2, 2) ax3 = fig.add_subplot(2, 2, 3)
plt.plot(np.random.randn(50).cumsum(), 'k--') #在最后创建的小窗口中绘图
"k--"是一个线型选项,用于告诉matplotlib绘制黑色虚线图。
上面那些由 fig.add_subplot所返回的对象是AxesSubplot对象,直接调用它们的实例方法就可以 在其它空着的格子里面画图了。
matplotlib有一个更为方便的 方法plt.subplots,它可以创建一个新的Figure,并返回一个含有已创建的subplot对 象的NumPy数组