模型评估与选择

zoukankan html css js c++ java

模型评估与选择

　　首先谈谈什么是“经验误差”与“过拟合”。我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”，学习器在训练集上的误差称为“训练误差”或“经验误差”；而在新样本上的误差称为“泛化误差”，显然，我们希望得到泛化误差小的学习器，但是若学习的太好是，就有可能把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质，这样就会导致泛化性能下降，这种现象称为“过拟合”，而与之相对的是“欠拟合”，即指对训练样本的一般性质尚未学好。

　　关于评估方法：即通过一个“测试集”来测试学习器对新样本的判别能力，然后以测试集上的“测试误差”作为泛化误差的近似。那么，如何划分训练集和测试集呢？第一种称为“留出法”，即将一个数据集划分两个部分，一个作为“训练集”，另一个作为“测试集”，至于怎么划分，这里就看比例了，而且不同比例的划分就会导致不同的误差的不同，所以一般对于留出法而言，一般要采用若干次随机划分、重复进行试验评估后取平均值作为留出法的评估结果；常见的做法是将数据集的2/3~4/5作为训练集，剩余的作为测试集。

　　关于调参：如何调参是一个非常重要的事，对于需要调参个数的增加，需要不同参数的调整将是非常大的挑战，现实中常用的方法是折中的方式：即对每个参数选定一个范围和变化步长，例如：[0,0.2]范围内以0.05作为步长，这样的选择就有5个选择，当然若参数较多，例如是三个参数，那么这样的调参就有5*5*5=125个。

查看全文

相关阅读:
快的打车技术部在杭州招聘 #年前面试年后入职#架构师
 王大锤_百度百科
 2013年总结
 泥沙俱下_百度百科
 thank you letter
上海投行需要一大群JAVA,C++,C#,UNIX.走过路过不要错过！过完年想换工作看过来初级资深都有
 外省人员-办理护照_百度经验
 敬请贤者：WEB、IOS开发（2年以上经验，大专）；CTO、产品经理，运营专员电商服装鞋饰买手（2年以上经验，服装或鞋类）；体验店店长（2年以上经验，服装或鞋类）工作地点：丰台南苑路；有意者小窗QQ2211788980
“快的打车”创始人陈伟星的新项目招人啦，高薪急招Java服务端/Android/Ios 客户端研发工程师/ mysql DBA/ app市场推广专家，欢迎大家加入我们的团队！
【深圳，武汉】一加科技（One Plus）招聘，寻找不...

原文地址：https://www.cnblogs.com/liyaofei/p/7536353.html