zoukankan      html  css  js  c++  java
  • 相关系数

    皮尔森相关系数

    概述

    皮尔森相关系数也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数,是最常用的一种相关系数。记为r,用来反映两个变量X和Y的线性相关程度,r值介于-1到1之间,绝对值越大表明相关性越强。

    定义

    总体相关系数ρ定义为两个变量X、Y之间的协方差和两者标准差乘积的比值,如下:

    [{ ho _{X,Y}} = frac{{{mathop{ m cov}} left( {X,Y} ight)}}{{{sigma _X}{sigma _Y}}} = frac{{Eleft[ {left( {X - {mu _X}} ight)left( {Y - {mu _Y}} ight)} ight]}}{{{sigma _X}{sigma _Y}}} = frac{{Eleft( {XY} ight) - Eleft( X ight)Eleft( Y ight)}}{{sqrt {Eleft( {{X^2}} ight) - {E^2}left( X ight)} sqrt {Eleft( {{Y^2}} ight) - {E^2}left( Y ight)} }}]

     

    物理意义

    皮尔森相关系数反映了两个变量的线性相关性的强弱程度,r的绝对值越大说明相关性越强。

    当r>0时,表明两个变量正相关,即一个变量值越大则另一个变量值也会越大;
    当r<0时,表明两个变量负相关,即一个变量值越大则另一个变量值反而会越小;
    当r=0时,表明两个变量不是线性相关的(注意只是非线性相关),但是可能存在其他方式的相关性(比如曲线方式);
    当r=1和-1时,意味着两个变量X和Y可以很好的由直线方程来描述,所有样本点都很好的落在一条直线上。
     

    机器学习中的应用

    pearson是用来反应俩变量之间相似程度的统计量,在机器学习中可以用来计算特征与类别间的相似度,即可判断所提取到的特征和类别是正相关、负相关还是没有相关程度。

    参考资料

    https://blog.csdn.net/chao2016/article/details/80917579

    https://www.cnblogs.com/renpfly/p/9555959.html

  • 相关阅读:
    1489 蜥蜴和地下室
    1521 一维战舰
    1596 搬货物
    1873 初中的算术
    CF-799B
    101 pick me up~
    落叶归根
    P1149 火柴棒等式
    P1540 机器翻译
    图论学习十之Sparse table
  • 原文地址:https://www.cnblogs.com/xumaomao/p/11307412.html
Copyright © 2011-2022 走看看