UNSW CV week3 上 Feature Representation

zoukankan html css js c++ java

UNSW CV week3 上 Feature Representation

https://echo360.org.au/lesson/61104790-7374-4fb6-90f9-e6727c6f20e2/classroom#sortDirection=desc

https://webcms3.cse.unsw.edu.au/COMP9517/20T2/resources/46773

总结：

目的：

　　1000*1000的图像就有一百万个像素点，如果以此来操作太computational-expensive。提取features更方便和robust

Intuitive examples of image features:

　　– Blobs 比如白云

　　– Edges from dark to bright

　　– Corners 　　

　　– Ridges from dark to bright to dark again

　　– Circles

　　– Ellipses

　　– Lines

　　– Etc…

Colour Features:

　　1. Colour Histogram:

　　　　操作： RGB三色直方图，每色有256个可选intensity，直方图的高度即为每个值对应的pixels的数量，这样一个直方图可以用一个 256维的vector

　　　　　　　RGB三色即有768维的vector，which is still very big and need to be reduced

　　　　

　　2. Colour Moments:

　　　　1）只取RGB每个channel的 First/Second/Third Order，得到一个 9维vector，一般前两/三个Order就够了；

　　　　2）当然9维Vector没有直方图的768维Vector含有的信息多，我们需要做Trade-off。

　　　　

Texture Features

　　1. Haralick Features :

　　　　1）以下图为例，左一图为给定的Input，生成以距离，角度为参数的matrix；

　　　　　　左二图 P（1，0°）即为图中距离为1，角度为0°或180°中能互相到达的像素的数量

　　　　　　比如P（1，0°）[ 0,0 ] = 4；即为左一图中，intensity 0 能到达 intensity 0 在距离为1的neighbourhood矩阵中，角度为 0°或180°，能互相到达4次。

　　　　　　即 Matrix[0,0] -> Maxtrix[0,1] Matrix[0,1] -> Maxtrix[0,0] Matrix[1,0] -> Maxtrix[1,1] Matrix[1,1] -> Maxtrix[1,0] 4次（Matrix即为左一Input）

　　　　　　P（1，0°）[ 2,2 ] = 6；即为 Matrix[2,1] -> Maxtrix[2,2] Matrix[2,2] -> Maxtrix[2,1] Matrix[2,2] -> Maxtrix[2,3] Matrix[2,3] -> Maxtrix[2,2]

　　　　　　　　　　　　　　　　　　　Matrix[3,0] -> Maxtrix[3,1] Matrix[3,1] -> Maxtrix[3,0]

　　　　2) 从创建的GLCMs矩阵中提取features/descriptors:方差，熵

　　

　　

　　

　　　　3）举例

　　　　　　预处理，提取各种features from ROI，特征选择，分类

　　　　

　　2. Local Binary Patterns （LBP）

　　　　1）把图片分成N*N的cells

　　　　2）对cell中的每个pixel比较其周围8个pixels的的大小，中心value大，对应位填0；其他填1

　　　　　　例如下图 2比 0 0 0 1 大，小于等于 2 2 2 3，所以得到8位LBP 11110000

　　　　3）每个像素对应的8位LBP有2^8=256种可能性（每位可取0，1）。对每个cell的LBP情况做一个直方图，统计256种情况出现的次数。

　　　　4）将所有cells的直方图combine在一起得到image-level的LBP feature descriptor.

　　　　5)　变种

　　　　　　（1）将上述选取距离为1的8个邻居判断记为P=8，R=1；

　　　　　　（2）由此可延申出多种LBP 如 P=12 R = 1.5 等

　　　　6）改进

　　　　　　（1）由于P=8,R=1时，得到的8位LBP具有可旋转性；

　　　　　　（2）选取8种旋转情况中，二进制最小值为取值

　　　　　　　　　　即 11110000（240） -》00001111（15）

　　　　　　（3）这样256种取值可简化至36种

　　　

　　

　　　　

　　　　

　　　　

　　

　　3. Scale-invariant feature transform (SIFT)

　　　　https://blog.csdn.net/u010440456/article/details/81483145

　　　　1）SIFT descriptor is invariant to 缩放，方向； partially invariant 失真，光照变化；

　　　　2）步骤：

　　　　　　（1）找到所有 Difference of Gaussian 图片中的极值点作为keypoint

　　　　　　（2）除掉low-contrast和edge 上的一些keypoint

　　　　　　（3）用梯度向量计算方向（不会 - - 好复杂）

　　　　　　（4）计算梯度方向直方图（放弃了）

　　

　　

　　

　　

　　

　　

查看全文

相关阅读:
聊聊 API Gateway 和 Netflix Zuul
现行统编中学数学教科书有多烂
 线程池的成长之路
 Quick Guide to Microservices with Spring Boot 2.0, Eureka and Spring Cloud
以太坊、Hyperledger Fabric和Corda，哪个更好？
【SFA官方翻译】Spring WebFlux和Spring Cloud进行响应式微服务开发
 goroutine背后的系统知识
 goroutine与调度器
 MySQL命令，一篇文章替你全部搞定
 微服务架构技术栈选型手册（万字长文）

原文地址：https://www.cnblogs.com/ChevisZhang/p/13160696.html