zoukankan      html  css  js  c++  java
  • 切比雪夫不等式——用于异常检测,基本假设:“几乎所有”值都会“接近”平均,如果偏差大就认为异常

    切比雪夫不等式

    维基百科,自由的百科全书
     
     
    跳到导航跳到搜索

    概率论中,切比雪夫不等式英语:Chebyshev's Inequality)显示了随机变量的“几乎所有”值都会“接近”平均。在20世纪30年代至40年代刊行的书中,其被称为比奈梅不等式(英语:Bienaymé Inequality)或比奈梅-切比雪夫不等式(英语:Bienaymé-Chebyshev Inequality)。切比雪夫不等式,对任何分布形状的数据都适用。可表示为:对于任意{displaystyle b>0}b>0,有:

    {displaystyle P(|X-E(X)|geqslant b)leq {frac {Var(X)}{b^{2}}}}{displaystyle P(|X-E(X)|geqslant b)leq {frac {Var(X)}{b^{2}}}}

    概念[编辑]

    这个不等式以数量化这方式来描述,究竟“几乎所有”是多少,“接近”又有多接近:

    • 与平均相差2个标准差以上的值,数目不多于1/4
    • 与平均相差3个标准差以上的值,数目不多于1/9
    • 与平均相差4个标准差以上的值,数目不多于1/16

    ……

    • 与平均相差k个标准差以上的值,数目不多于1/k2

    举例说,若一班有36个学生,而在一次考试中,平均分是80分,标准差是10分,我们便可得出结论:少于50分(与平均相差3个标准差以上)的人,数目不多于4个(=36*1/9)。
    公式:{displaystyle P(mu -ksigma <X<mu +ksigma )geq 1-{frac {1}{k^{2}}}}P(mu -ksigma <X<mu +ksigma )geq 1-{frac  {1}{k^{2}}}

    推论[编辑]

    测度论说法[编辑]

    设(X,Σ,μ)为一测度空间f为定义在X上的广义实可测函数。对于任意实数t > 0,

    {displaystyle mu ({xin X\,:\,\,|f(x)|geq t})leq {1 over t^{2}}int _{X}f^{2}\,dmu .}mu ({xin X\,:\,\,|f(x)|geq t})leq {1 over t^{2}}int _{X}f^{2}\,dmu .

    一般而言,若g是非负广义实值可测函数,在f的定义域非降,则有

    {displaystyle mu ({xin X\,:\,\,f(x)geq t})leq {1 over g(t)}int _{X}gcirc f\,dmu .}mu ({xin X\,:\,\,f(x)geq t})leq {1 over g(t)}int _{X}gcirc f\,dmu .

    上面的陈述,可透过以|f|取代f,再取如下定义而得:

    {displaystyle g(t)={egin{cases}t^{2}&{mbox{if }}tgeq 0\0&{mbox{otherwise,}}end{cases}}}g(t)={egin{cases}t^{2}&{mbox{if }}tgeq 0\0&{mbox{otherwise,}}end{cases}}

    概率论说法[编辑]

    {displaystyle X}X为随机变量,期望值{displaystyle mu }mu 标准差{displaystyle sigma }sigma 。对于任何实数k>0,

    {displaystyle Pr(left|X-mu ight|geq ksigma )leq {frac {1}{k^{2}}}.}Pr(left|X-mu 
ight|geq ksigma )leq {frac  {1}{k^{2}}}.

    改进[编辑]

    一般而言,切比雪夫不等式给出的上界已无法改进。考虑下面例子:

    {displaystyle Pr(X=1)=Pr(X=-1)=1/(2k^{2})}Pr(X=1)=Pr(X=-1)=1/(2k^{2})
    {displaystyle Pr(X=0)=1-1/k^{2}}Pr(X=0)=1-1/k^{2}

    这个分布的标准差{displaystyle sigma =1/k}sigma =1/k{displaystyle mu =0}mu=0

    对于任意分布形态的数据,根据切比雪夫不等式,至少有 {displaystyle 1-1/k^{2}}1-1/k^{2} 的数据落在k个标准差之内。其中k>1,但不一定是整数。

    当只求其中一边的值的时候,有Cantelli不等式

    {displaystyle Pr(X-mu geq ksigma )leq {frac {1}{1+k^{2}}}.}Pr(X-mu geq ksigma )leq {frac  {1}{1+k^{2}}}.[1]

    证明[编辑]

    定义{displaystyle ~A_{t}:={xin Xmid f(x)geq t}}~A_{t}:={xin Xmid f(x)geq t},设{displaystyle 1_{A_{t}}}1_{{A_{t}}}为集{displaystyle ~A_{t}}~A_{t}指标函数,有

    {displaystyle 0leq g(t)1_{A_{t}}leq gcirc f\,1_{A_{t}}leq gcirc f,}0leq g(t)1_{{A_{t}}}leq gcirc f\,1_{{A_{t}}}leq gcirc f,
    {displaystyle g(t)mu (A_{t})=int _{X}g(t)1_{A_{t}}\,dmu leq int _{A_{t}}gcirc f\,dmu leq int _{X}gcirc f\,dmu .}g(t)mu (A_{t})=int _{X}g(t)1_{{A_{t}}}\,dmu leq int _{{A_{t}}}gcirc f\,dmu leq int _{X}gcirc f\,dmu .

    又可从马尔可夫不等式直接证明:马氏不等式说明对任意随机变量Y和正数a{displaystyle Pr(|Y|>a)leq operatorname {E} (|Y|)/a}Pr(|Y|>a)leq operatorname {E}(|Y|)/a。取{displaystyle Y=(X-mu )^{2}}Y=(X-mu )^{2}{displaystyle a=(ksigma )^{2}}a=(ksigma )^{2}

    亦可从概率论的原理和定义开始证明:

    {displaystyle Pr(|X-mu |geq ksigma )=operatorname {E} (I_{|X-mu |geq ksigma })=operatorname {E} (I_{[(X-mu )/(ksigma )]^{2}geq 1})}Pr(|X-mu |geq ksigma )=operatorname {E}(I_{{|X-mu |geq ksigma }})=operatorname {E}(I_{{[(X-mu )/(ksigma )]^{2}geq 1}})
    {displaystyle leq operatorname {E} left(left({X-mu over ksigma } ight)^{2} ight)={1 over k^{2}}{operatorname {E} ((X-mu )^{2}) over sigma ^{2}}={1 over k^{2}}.}leq operatorname {E}left(left({X-mu  over ksigma }
ight)^{2}
ight)={1 over k^{2}}{operatorname {E}((X-mu )^{2}) over sigma ^{2}}={1 over k^{2}}.

    参见[编辑]

    参考来源[编辑]

    • 《基本统计学 观念与应用二版》,林惠玲 陈正仓 著
    • 《应用统计学 第四版》 修订版,林惠玲 陈正仓 著
  • 相关阅读:
    c语言结构体数组引用
    c语言结构体数组定义的三种方式
    如何为SAP WebIDE开发扩展(Extension),并部署到SAP云平台上
    SAP SRM ABAP Webdynpro和CFCA usb key集成的一个原型开发
    使用SAP API portal进行SAP SuccessFactors的API测试
    SAP UI5应用里的页面路由处理
    在SAP WebIDE Database Explorer里操作hdi实例
    如何使用SAP事务码SAT进行UI应用的性能分析
    使用SAP WebIDE进行SAP Cloud Platform Business Application开发
    SAP CRM WebClient UI ON_NEW_FOCUS的用途
  • 原文地址:https://www.cnblogs.com/bonelee/p/11054494.html
Copyright © 2011-2022 走看看