7.1过拟合的问题
训练集表现良好,测试集表现差。鲁棒性差。以下是两个例子(一个是回归问题,一个是分类问题)
解决办法:
(1)丢弃一些不能帮助我们正确预测的特征。可以使用工选择保留哪些特征,或者使用一些模型选择的算法来帮忙(PCA);
(2)正则化。保留素有的特征,但是减少参数的大小。
7.2代价函数
其中λ称为正则化参数。
经过正则化处理的模型和原模型的可能对比如如下:
不对θ0正则化。
7.3正则化线性回归
对于j=1,2,3……有:
可以看出,正则化线性回归的梯度下降法的变化在于,每次都会在原有算法的更新规则的基础上令θ值减少了一个额外的值。