偏差反映的是模型在样本上的输出和真实值之间的误差(偏离程度),即模型本身的准确度,拟合能力;
解决:使用更复杂的模型,使用更多的特征。
方差反映的是模型每一次随数据集的变动造成的输出结果与模型输出期望之间的误差,即模型稳定性。
机器学习模型中权衡两者,达到一个tradeoff的性能。
解决:使用交叉验证,简化模型,减少所用特征维数,使用正则化方法。
避免过拟合和欠拟合:选择更有代表性的特征,使用更多的特征来避免欠拟合;
增大数据集,使用更多的数据;减少特征维数,特征降维;使用正则化方法;使用交叉验证方法来避免模型的过拟合。
<script>
(function(){
function setArticleH(btnReadmore,posi){
var winH = $(window).height();
var articleBox = $("div.article_content");
var artH = articleBox.height();
if(artH > winH*posi){
articleBox.css({
'height':winH*posi+'px',
'overflow':'hidden'
})
btnReadmore.click(function(){
articleBox.removeAttr("style");
$(this).parent().remove();
})
}else{
btnReadmore.parent().remove();
}
}
var btnReadmore = $("#btn-readmore");
if(btnReadmore.length>0){
if(currentUserName){
setArticleH(btnReadmore,3);
}else{
setArticleH(btnReadmore,1.2);
}
}
})()
</script>
</article>