哪些 Python 库让你相见恨晚？

zoukankan html css js c++ java

哪些 Python 库让你相见恨晚？
作者：刘十九
链接：https://www.zhihu.com/question/24590883/answer/28377017
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

相见恨晚的库有很多啊
决定利用午休的时间，把曾经惊艳过我的库都整理出来好了
还不勇敢的点赞么亲
马上为你呈上一锅热腾腾的美味，当当当当

web框架:

django

flask

tornado

bottle

微信框架：

WeRoBot

网络：

requests

httpie

爬虫：

scrapy

系统方面：

fabric

ansible

ORM：

peewee

sqlalchemy

模板引擎：

jinja2

图像处理：

Pillow

Python Imaging Library (PIL)

命令行应用：

docopt

静态网站生成器

pelican

数据处理：

pandas

其他：

awesome-python

-------------我是分割线-------------
此外我对django关注比较多，专门列出django部分
等有空再对其做细分

django-debug-toolbar

django-rest-framework

django-xadmin

wagtail

pinax

mezzanine

django-crispy-forms

django-compressor

django-grappelli

django-taggit

django-basic-apps

django-userena

django-mptt

sorl-thumbnail

django-guardian

django-pipeline
作者：龙鹏-言有三
链接：https://www.zhihu.com/question/24590883/answer/652463850
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

推荐一波爬虫库供玩耍吧，参考
龙鹏-言有三：【杂谈】GitHub上有哪些好用的爬虫(从Google百度，腾讯视频抖音，豆瓣知乎到不可描述)zhuanlan.zhihu.com
1、awesome-spider

地址：https://github.com/facert/awesome-spider

这是ID为facert的一个知乎工程师开源的，star6000+，内容如下：

这一款爬虫，里面搜集了几乎所有可以爬取的中文网址，从知乎豆瓣到知网，抖音微博到QQ，还有很多的不可描述的网站，你懂的。

2、Nyspider

地址：https://github.com/Nyloner/Nyspider

这是ID为Nyloner的一个今日头条的工程师弄的，star1000+，风格与上面的项目大有不同。

可以看出，都是各类网址。这很头条，跟这位小哥哥的工作内容估计有关系。

3、awesome-python-login-model

地址：https://github.com/CriseLYJ/awesome-python-login-model

这是ID为CriseLYJ(职业不详)的用户，这个项目用于模拟各种网址登陆，也包含一些简单的爬虫，star6000+。

先从这个项目开始分析各大网站的登录方式，非常有用，可谓摸清对手再动手。

4、python-spider

地址：https://github.com/Jack-Cherish/python-spider

这是ID为Jack-Cherish的东北大学的一个学生整理的学习python爬虫的资料，star6000+，包含不少的实战项目，非常适合想学习的朋友。

其他还有一些项目，不再一一介绍。

https://github.com/jhao104/proxy_pool https://github.com/Ehco1996/Python-crawler

--------------------------------------此处是分割线--------------------------------------

如果你是做图像的，我再推荐两个功能强大，简单好用的图片和视频爬虫。工具亲测长期有效，省去了很多找爬虫工具的时间，早用早好。

1、Google，Baidu，Bing三大搜素引擎图片爬虫

地址：https://github.com/sczhengyabin/Image-Downloader

这个爬虫由ID为sczhengyabin的用户整理，可以按要求爬取百度、Bing、Google上的图片，我已经用了几年了，提供了非常人性化的GUI方便操作，使用方法如下：

使用python image_downloader_gui.py调用GUI界面，配置好参数(关键词，路径，爬取数目等)，关键词可以直接在这里输入也可以选择从txt文件中选择。

可以配置需要爬取的样本数目，这里一次爬了2000张，妥妥的3分钟搞定。

这个爬虫足够满足小型项目初始数据集的积累(爬几千张高质量图片妥妥的)，结果命名也非常整齐规范，最大的优势就是稳定啊，不会三天两天不能用了。

2、各大视频网站爬虫

地址：https://github.com/iawia002/annie

由ID为iawia002的用户整理，Annie是一款以go语言编码的视频下载工具，使用便捷并支持youtube，腾讯视频，抖音等多个网站视频和图像的下载，收录站点如下，可以说是该有的都有的：

虽然这个项目可以下载图片，但是我们还是来用它下载视频吧，使用方法很简单：

annie ［可选参数］http://… (视频网址)

视频会下载到当前目录，至于那些可选参数，赶紧去摸索吧。
查看全文

相关阅读:
【转载】数据结构与算法设计
 【转载】简述Linux的启动过程
 【转载】20分钟MySQL基础入门
 【转载】linux内核笔记之进程地址空间
 【转载】linux内核笔记之高端内存映射
 Logical Address->Linear Address->Physical Address
【转载】教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
 【转载】不会编程也能写爬虫？可视化爬虫工具是什么东东
 【转载】我是一个键盘
 80. Remove Duplicates from Sorted Array II

原文地址：https://www.cnblogs.com/valorchang/p/11288009.html

哪些 Python 库让你相见恨晚？

推荐一波爬虫库供玩耍吧，参考

1、awesome-spider

2、Nyspider

3、awesome-python-login-model

4、python-spider

1、Google，Baidu，Bing三大搜素引擎图片爬虫

2、各大视频网站爬虫