进行相似度度量的时候会用到各种度量距离的方法,根据MATLAB的help文档整理如下:
关于各种距离的定义:
求 和 之间的距离
1.欧式距离(Euclidean distance): ,写成向量形式;
2.曼哈顿距离又叫城市街区距离(CityBlock distance) :
3.切比雪夫距离(Chebychev distance): ,也可以表示成
4.以上三种称为闵式距离,形式为,p=1时是曼哈顿距离;p=2时是欧氏距离;p趋于无穷时是切比雪夫距离。
5.马氏距离(Mahalanobis distance):记两个(或多个)样本的协方差矩阵为S,则马氏距离为
6.汉明距离(Hamming distance):主要针对信息编码,指的是将其中的一个变量变成另外一个变量所需要的替换次数。1001到1111的汉明距离是2。
7.杰卡德距离( Jaccard distance):用来衡量两个集合中元素的相似度 , 表示集合中元素的个数。