zoukankan      html  css  js  c++  java
  • 可决系数R^2和MSE,MAE,SMSE

    波士顿房价预测

    首先这个问题非常好:+1:
    其实要完整的回答这个问题很有难度,我也没有找到一个完整叙述这个东西的资料,所以下面主要是结合我自己的理解和一些资料谈一下r^2,mean square error 和 mean absolute error。可能不是很完整,供参考:grin:

    MSE


    这个应用应该是最广的,因为他能够求导,所以经常作为loss function。计算的结果就是你的预测值和真实值的差距的平方和。

    MAE


    这个用的不是上面的平方项了,而是用了绝对值项。

    R^2


    看公式其实不难发现,它和MSE是有相似的,关键在于下面除了一个东西。简单的想就是相当于对预测值和真实值的趋势做了一个对比。

    SMSE

    比较

    首先从公式也能看出来,这三个基本上是R^2算一类,然后MSE和MAE算另一类。为什么呢?因为R^2相当于是对所有的数据都会有一个相同的比较标准。也就是说你得到一个值0.9999,那就非常好(当然对不同的应用你对好的定义可能会不一样,比如某些你觉得0.6就够了,某些你要0.8)。而MAE和MSE就是数据相关了,范围可以非常大,你单纯根据一个值完全不知道效果怎么样。

    而MAE 和MSE的选择主要是取决于你的应用场景,因为MSE会对离平均较远的点给一个更大的惩罚值(有平方嘛),而MAE则是给一个相对更小的。这个你可以参考这个链接3

    This depends on your loss function. In many circumstances it makes sense to give more weight to points further away from the mean--that is, being off by 10 is more than twice as bad as being off by 5. In such cases RMSE is a more appropriate measure of error.

    If being off by ten is just twice as bad as being off by 5, then MAE is more appropriate.

    http://stats.stackexchange.com/questions/48267/mean-absolute-error-or-root-mean-squared-error

    题目中为什么用了R^2

    这个我也是猜猜(毕竟不是我出的嘛),因为如果用另两个的话,你得出一个结果6.66,那么你怎么说这个好还是不好?根本没法说嘛。那这个问题你就没法回答了。

    PS:其实老版的project里面就有一个问题是说,让你为这个问题选择一个performance metric,其中最难分辨的就是MAE和MSE,你可以考虑下这个问题用哪个更好。

    来源:  http://blog.csdn.net/duxinyuhi/article/details/52233993

  • 相关阅读:
    记录log中的16进制和ASCII码字符输出
    有效的沟通技巧
    时间的真谛
    目标设定与时间管理
    第四代时间管理
    什么是高效沟通
    error LNK1104: cannot open file 错误解决方案
    js压缩工具1.0界面绘制
    时间管理的定义与目的
    JArgs命令行选项解析>Java套件
  • 原文地址:https://www.cnblogs.com/tibetanmastiff/p/6692676.html
Copyright © 2011-2022 走看看