zoukankan      html  css  js  c++  java
  • 从向量夹角理解皮尔逊相关系数

    两个向量的乘积一般有内积(点积)、外积之分,假设两个向量 a = [a1, a2,…, an]和b = [b1, b2,…, bn],

    内积则为:a·b =a1b1+a2b2+……+anbn  =|a|·|b|cosθ

    两向量夹角为:

    cosθ =a·b /|a|·|b| =a1b1+a2b2+……+anb/ |a|·|b| =(a1b1+a2b2+……+anbn) /[ (a1²+a2²+...+an²) · (b1²+b2²+...+bn²)]−½

    而皮尔逊相关系数为:

    r(X,Y) =Cov(X,Y) /δX·δY =E[ (X -E(X)) ·(Y -E(Y)] /δX·δY =E[ (X -E(X)) ·(Y -E(Y)] /[ E( X -E(X))² ·E( Y -E(Y))²]½ =∑[ (X -E(X)) ·(Y -E(Y)] /[ ∑( X -E(X))² ·∑( Y -E(Y))²]½ 

    仔细比较一下会发现 求向量夹角的公式和皮尔逊公式之间很相似!但有一点点不一样。

    不同点主要有2个:

    (1)皮尔逊公式做了数据中心化处理,相当于把均值当作笛卡尔坐标系的原点,所以在分子和分母中都出现了减去均值的操作。

    (2)向量夹角公式用于笛卡尔坐标系,是二维平面,而皮尔逊公式的维度则等于数据序列的长度,它相当于在比较两个n维空间中的向量的夹角,其中n等于数据序列的长度。

    意义:皮尔逊相关系数越大,表示两向量间余弦值就越大,向量的夹角越小,两个向量就越一致,即越相关。

    聪明 皮实 乐观 自省
  • 相关阅读:
    定义和使用EL函数
    在Java Web程序中使用Hibernate
    JDBC在Java Web中的应用——分页查询
    JDBC调用存储过程
    使用navicat工具创建MySQL存储过程
    JDBC操作数据库的批处理
    JDBC操作数据库
    Servlet监听器统计在线人数
    Servlet字符编码过滤器
    Servlet过滤器创建与配置
  • 原文地址:https://www.cnblogs.com/zwt20120701/p/15540352.html
Copyright © 2011-2022 走看看