本文梳理一下计算机领域的知识体系,体系中知识点的选取有很强的个人色彩。本文把计算机视觉的内容概括为以下几个方面:
- 图像处理
- 传统计算机视觉
- 深度学习
- 编程语言Python
- 深度而学习框架PyTorch
----------------------------------------------------------------------------------------------------------
图像处理(建议使用冈萨雷斯的《数字图像处理》学习相关知识)
数字摄像过程
图像灰度变换
图像反转
幂次变换,如gamma变换
分段线性变换
直方图
直方图和累积直方图
直方图均衡
直方图匹配
空间域图像增强
图像平滑
图像锐化:拉普拉斯算子
中值滤波
双边滤波
频率域图像增强
低通滤波
高通滤波
频率域锐化
同态滤波器
图像复原,如去噪
噪声模型
噪声参数的估计
去噪:均值滤波,中值滤波
估计退化函数
彩色图像处理
彩色模型
伪彩色
彩色变换
小波变换和多分辨率处理
图像金字塔
小波变换
图像压缩与编码
形态学处理
膨胀与腐蚀
边界提取
孔洞填充
图像分割
边缘检测:sobel算子等
Hough变换
阈值分割
区域分割
----------------------------------------------------------------------------------------------------------
传统计算机视觉(可参考《计算机视觉:一种现代方法》等书)
特征点检测:Harris, SIFT, SURF, ORB
特征提取:PCA
相机标定
运动估计:光流法等
待补全并组成体系......
----------------------------------------------------------------------------------------------------------
深度学习
反向传播算法
激活函数:Sigmoid, tanh, ReLu, LeakyReLu, Parameter ReLu, Random ReLu
损失函数
防止过拟合技术
dropout
Batch Normalization
L1 regularization
L2 regularization
数据增强
提前停止训练
卷积神经网络基础
LeNet
AlexNet
paper
实例
VGGNet
paper
实例1:
实例2
GoogLeNet
ResNet
RCNN
SPPNet
Fast-RCNN
Faster-RCNN
----------------------------------------------------------------------------------------------------------
编程语言Python
numpy
matplotlib
OpenCV
pandas
----------------------------------------------------------------------------------------------------
一个框架PyTorch
PyTorch基础
PyTorch tutorial
pytorch的实例
pytorch的可视化TensorBoard