week 4 ridge regression

zoukankan html css js c++ java

week 4 ridge regression
coursera 上的华盛顿大学 machine learning： regression 第四周笔记

通常，过拟合的一个表现是拟合模型的参数很大。

为了防止过拟合

Total cost = measure of fit + measure of magnitude of coefficients

前者描述训练集拟合程度，后者评估回归模型系数大小，小则不会过拟合。

评估训练集拟合程度（ measure of fit ）：

　　　　

　　RSS(w) 越小，拟合程度越好。

评估回归模型系数（measure of magnitude of coefficients）：

（1）系数绝对值之和 |w|， L1范数

（2）系数平方和 ||w||²，L2范数

岭回归：计算回归系数时使（ RSS(w)+λ||w||² ）最小

　　　　其中λ为平衡训练集拟合程度和拟合系数大小的调整参数。

在λ的选择上体现了 bias-variance tradeoff:

对于大的λ：high bias, low variance

对于小的λ：low bias, high variance

如何确定 λ 大小？

　　理想条件下（数据集足够大）：

　　training set: 训练集用于拟合回归模型

　　validation set: 检测系数大小，用于确定λ

　　test set: 测试集，计算泛化误差（generalization error)

　　

　　实际情况下，数据集有限，常用方法有：

　　　　　K - fold cross validation

　　　　步骤：

　　　　对于每一个需要评估的 λ:

　　　　　　将数据集分为training set 和 test set；

　　　　　　将其中training set 打乱顺序（随机排序），分成 k 等分。

　　　　　　k 次循环，每次将k等份中其中一份作为 validation set, 剩下部分作为 training set

　　　　　　每次根据validation set 计算 error (λ), 结果为k次计算的平均值。

　　　　　　average （error (λ)）最小的为最合适的λ

梯度下降法求回归系数：

total cost = RSS(w)+λ||w||²
Cost(w)= SUM[ (prediction - output)^2 ]+ l2_penalty*(w[0]^2 + w[1]^2 + ... + w[k]^2).
求导：
derivative = 2*SUM[ error*[feature_i] ] + 2*l2_penalty*w[i].
（其中没有2*l2_penalty*w[0]这一项）

每次迭代：
predictions = predict_output(feature_matrix, weights) errors = predictions - output
for i in xrange(len(weights)): feature = feature_matrix[:, i] derivative = compute_derivative_ridge(errors, feature, weights[i], l2_penalty)
weights[i] = weights[i] - step_size * derivative
查看全文

相关阅读:
渗透利器-kali工具 (第六章-1) 密码破解
 渗透利器-kali工具 (第五章-6) Metasploit后门生成模块
 渗透利器-kali工具 (第五章-5) Metasploit漏洞利用模块二
 渗透利器-kali工具 (第五章-4) Metasploit漏洞利用模块一
 渗透利器-kali工具 (第五章-3) Metasploit密码爆破模块
 渗透利器-kali工具 (第五章-2) Metasploit扫描漏洞模块
 渗透利器-kali工具 (第五章-1) Metasploit框架介绍与基本命令
 关于计算机网络的性能指标你需要知道这些
 写给大忙人看的计算机网络参考模型
 PHP基础编程之鬼斧神工的正则表达式-正则表达式基本语法+简单实例

原文地址：https://www.cnblogs.com/smartweed/p/8486059.html