机器学习西瓜书笔记---3.3、对数几率回归

zoukankan html css js c++ java

机器学习西瓜书笔记---3.3、对数几率回归

机器学习西瓜书笔记---3.3、对数几率回归

一、总结

一句话总结：

【系统】：系统的学习非常非常重要，所以看书是非常非常必要且高效的

你之前【很多不懂的问题】，系统看书，【书上介绍的不能再详细】

1、为什么从阶跃函数变成对数几率函数（sigmoid）？

【阶跃函数不连续，不可求导】：单位阶跃函数不连续，因此不能直接用作式（3.15）中的g（-）.于是我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”（arrogate function），并希望它【单调可微】.对数几率函数（logistic function）正是这样一个常用的替代函数：$$y = frac { 1 } { 1 + e ^ { - z } }$$

2、什么是对数几率回归？

【对数几率函数】：$$y = frac { 1 } { 1 + e ^ { - z } }$$

【对数几率回归】就是【逻辑回归】：$$y = frac { 1 } { 1 + e ^ { - ( w ^ { T } x + b ) } }$$

由此可看出，式（3.18）实际上是在用线性回归模型的预测结果去【逼近真实标记的对数几率】，因此，其对应的模型称为“对数几率回归”（logistic regression，亦称 logit regression）.

特别需注意到，虽然它的名字是“回归”，但实际却是一种【分类学习方法】：是因为在【用回归（线性回归）做分类的事情】

3、为什么有对数几率回归？

上一节讨论了如何使用线性模型进行回归学习，但【若要做的是分类任务该怎么办】？

答案蕴涵在广义线性模型中：【只需找一个单调可微函数将分类任务的【真实标记y】与线性回归【模型的预测值】联系起来】

考虑二分类任务，其输出标记【y∈{0，1}】，而线性回归模型产生的预测值_$z = w ^ { T } x + b_$是【实值】，于是，我们需【将实值z转换为0/1值】.最理想的是【“单位阶跃函数”（unit-step function）】:$$y = left{ egin{array} { c l } { 0 , } & { z < 0 } \ { 0.5 , } & { z = 0 } \ { 1 , } & { z > 0 } end{array} ight.$$

若预测值【z大于零就判为正例，小于零则判为反例】，预测值为临界值零则可任意判别

4、对数几率回归中的几率和对数分别指什么？

【对数几率回归】就是【逻辑回归】：$$y = frac { 1 } { 1 + e ^ { - ( w ^ { T } x + b ) } }$$

可化为：$$ln frac { y } { 1 - y } = w ^ { T } x + b$$

若将y视为样本x作为正例的可能性，则1-y是其反例可能性，【【两者的比值y/(1-y)】，称为“几率”（odds），反映了x作为正例的相对可能性】.

【对几率取对数】则得到“对数几率”（log odds，亦称 logit）：$$ln frac { y } { 1 - y }$$

5、注意对数几率函数与“对数函数”ln(-)不同？

对数几率函数：$$y = frac { 1 } { 1 + e ^ { - z } }$$

对数函数：ln(-)

6、对数几率回归的优点？

【直接建模，无需分布】：这种方法有很多优点，例如它是【直接对分类可能性进行建模，无需事先假设数据分布】，这样就避免了偎设分布不准确所带来的问题；

【不仅类别，而且预测出了概率】：它不是仅预测出【“类别”】，而是可得到【近似概率预测】，这对许多需利用概率辅助决策的任务很有用；

【方便求导】：此外，对率函数是【任意阶可导的凸函数】，有很好的数学性质，现有的许多【数值优化算法】都可直接用于求取最优解

二、内容在总结中

博客对应课程的视频位置：

我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

博主25岁，前端后端算法大数据人工智能都有兴趣。

大家有啥都可以加博主联系方式（qq404006308，微信fan404006308）互相交流。工作、生活、心境，可以互相启迪。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

26岁，真心找女朋友，非诚勿扰，微信fan404006308，qq404006308

人工智能群：939687837

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813 最近心境200830 最近心境201019 201218-210205

查看全文

相关阅读:
xshell中的nohup与&的含义
 eclipse启动服务报错:Exception in thread "main" java.lang.UnsupportedClassVersionError: org/apache/maven/cli/MavenCli : Unsupported major.minor version 51.0
关于MyEclipse启动报错:Error starting static Resources;下面伴随Failed to start component [StandardServer[8005]]; A child container failed during start.的错误提示解决办法.
组件/服务之间的通信-事件广播和订阅可以有效减少全局变量
 #css3# 可以多背景图设置
 #RXJS# 基础
 #TS# get/set
#css3# : vs ::
#css3# box-sizing
#DOM# 最佳实践：head里面标签的顺序

原文地址：https://www.cnblogs.com/Renyi-Fan/p/14052470.html

机器学习西瓜书笔记---3.3、对数几率回归

机器学习西瓜书笔记---3.3、对数几率回归

一、总结

一句话总结：

【系统】：系统的学习非常非常重要，所以看书是非常非常必要且高效的

你之前【很多不懂的问题】，系统看书，【书上介绍的不能再详细】

1、为什么从阶跃函数变成对数几率函数（sigmoid）？

2、什么是对数几率回归？

【对数几率函数】：$$y = frac { 1 } { 1 + e ^ { - z } }$$

【对数几率回归】就是【逻辑回归】：$$y = frac { 1 } { 1 + e ^ { - ( w ^ { T } x + b ) } }$$

由此可看出，式（3.18）实际上是在用线性回归模型的预测结果去【逼近真实标记的对数几率】，因此，其对应的模型称为“对数几率回归”（logistic regression，亦称 logit regression）.

特别需注意到，虽然它的名字是“回归”，但实际却是一种【分类学习方法】：是因为在【用回归（线性回归）做分类的事情】

3、为什么有对数几率回归？

上一节讨论了如何使用线性模型进行回归学习，但【若要做的是分类任务该怎么办】？

答案蕴涵在广义线性模型中：【只需找一个单调可微函数将分类任务的【真实标记y】与线性回归【模型的预测值】联系起来】

若预测值【z大于零就判为正例，小于零则判为反例】，预测值为临界值零则可任意判别

4、对数几率回归中的几率和对数分别指什么？

【对数几率回归】就是【逻辑回归】：$$y = frac { 1 } { 1 + e ^ { - ( w ^ { T } x + b ) } }$$

可化为：$$ln frac { y } { 1 - y } = w ^ { T } x + b$$

若将y视为样本x作为正例的可能性，则1-y是其反例可能性，【【两者的比值y/(1-y)】，称为“几率”（odds），反映了x作为正例的相对可能性】.

【对几率取对数】则得到“对数几率”（log odds，亦称 logit）：$$ln frac { y } { 1 - y }$$

5、注意对数几率函数与“对数函数”ln(-)不同？

对数几率函数：$$y = frac { 1 } { 1 + e ^ { - z } }$$

对数函数：ln(-)

6、对数几率回归的优点？

【直接建模，无需分布】：这种方法有很多优点，例如它是【直接对分类可能性进行建模，无需事先假设数据分布】，这样就避免了偎设分布不准确所带来的问题；

【不仅类别，而且预测出了概率】：它不是仅预测出【“类别”】，而是可得到【近似概率预测】，这对许多需利用概率辅助决策的任务很有用；

【方便求导】：此外，对率函数是【任意阶可导的凸函数】，有很好的数学性质，现有的许多【数值优化算法】都可直接用于求取最优解

二、内容在总结中

作者相关推荐