Pandas
是我最喜爱的库之一。通过带有标签的列和索引,Pandas
使我们可以以一种所有人都能理解的方式来处理数据。它可以让我们毫不费力地从诸如 csv
类型的文件中导入数据。我们可以用它快速地对数据进行复杂的转换和过滤等操作。Pandas
真是超级棒。
我觉得它和 Numpy
、Matplotlib
一起构成了一个 Python 数据探索和分析的强大基础。Scipy
当然也是一大主力并且是一个绝对赞的库,但是我觉得前三者才是 Python 科学计算真正的顶梁柱。
那么,赶紧看看 python 科学计算系列的第三篇推文,一窥 Pandas
的芳容吧。如果你还没看其它几篇文章的话,别忘了去看看。
导入 Pandas
第一件事当然是请出我们的明星 —— Pandas。
from pandas import Series, DataFrame import pandas as pd
这是导入 pandas
的标准方法。我们不想一直写 pandas
的全名,但是保证代码的简洁和避免命名冲突都很重要,所以折中使用 pd
。如果你去看别人使用 pandas
的代码,就会看到这种导入方式。