基础部分
- 字符串、列表、字典、集合、文件操作,循环
- sys模块,os模块
- hashlib模块,random模块,序列化(json,pickle),XML
- logging模块,shutil模块
- re模块,paramiko模块
- time模块,datetime模块
- 装饰器,迭代器生成器
- 面向对象编程
- 面向对象进阶(类的成员、成员修饰符、类的特殊成员)、反射、异常处理、断言
- 多线程,多进程,协程
- socket,IO多路复用(select),socket server实现多并发
- 连接mysql
- 连接Redis数据库
- 连接MongoDB
- Python操作Solr索引库
- 算法(时间复杂度,空间复杂度,二分查找,排序们)
- 数据结构(栈,队列,链表)
Django
- 创建Django工程,app,模板语言
- 路由系统,视图(接收文件等)
- model(建表,增删改查,外键,多对多)
- model中的参数
- 母版,自定义simple-tag函数,分页,cookie
- session,csrf,中间件,信号,缓存
- form表单验证(创建,内置字段,自定义异常,form表单的前端数据实时更新)
- ModelForm(建立,参数,自定义错误验证)
- 3种ajax提交方式+上传文件,验证码,KindEditor使用
- 组合搜索,jsonp,xss过滤(bs4)
- 部署
爬虫
- HTTP与HTTPS,爬虫模块的基本使用+获取post,get,ajax方式加载的网页的数据
- 爬虫引擎,re模块,lxml库
- BeautifulSoup4解析器,JSON与JsonPATH,多线程爬虫,动态HTML处理
- Scrapy框架简介、内置选择器、管道文件、爬虫模块中的spider类
- CrawlSpiders类(深入爬取)
- scrapy的三种登录方式,下载中间件(Downloademiddleware),settings文件
- scrapy-redis分布式组件