1.3 Essential Python Libraries(一些重要的Python库)
如果不了解Python的数据生态,以及本书中即将用到的一些库,这里会做一个简单的介绍:
Numpy
这里就不过多介绍了,下面给出一些链接可以参考。这个库太重要了,Python之所以能在科学计算上独领风骚很大程度上就是因为这个库。它还影响了另一个很有名的深度学习库,PyTorch。
- Wiki:NumPy
- Baidu:NumPy
- 使用 Python 进行科学计算:NumPy入门
- NumPy用户指南
详情可见第4章。
pandas
本书的主角,用于进行数据处理和清洗的利器。详情可见第5章。
matplotlib
用于绘图和数据可视化,详情可见第9章。
IPython and Jupyter
本书的笔记就是使用Jupyter来制作的,详细内容可以查看下面的资料。
- IPython 与 Jupyter 相关概念介绍
- IPython和Jupyter Notebook
- Jupyter官网
- Jupyter Notebook Tutorial: Introduction, Setup, and Walkthrough(视频,需要翻墙)
SciPy
scikit-learn
集成了很多机器学习模型,如果搞机器学习的话这个包一定要好好学。虽然13.4做了介绍,但我觉得还是不够,想要深入的话推荐大家再去多看资料和书籍进行学习。
statsmodels
【量化课堂】Statsmodels 统计包之 OLS 回归
Welcome to Statsmodels’s Documentation