机器学习中分类问题 - 走看看

zoukankan html css js c++ java

机器学习中分类问题
regression与线性回归（linear regression）

线性回归（linear regression）：
有监督学习 => 学习样本为D={(xi,yi)}ª

输出/预测的结果yi为连续值变量

需要学习映射f：x～y

假定输入x和输出y之间有线性相关关系　　

损失函数(loss function)

我们要找到最好的权重/参数Θ

怎么去衡量“最好”? 定义损失函数

最小化损失函数梯度下降（Gradient descend）

逐步最小化损失函数的过程

如同下山，找准方向(斜率)，每次迈进一小步，直至山底

找到合适的学习率（步长），再进行训练，否则特征多，样本的多的情况下成本会很大的。

数学和工程区别是工程找到大致可用的就可以了，数学是找打最优解。

特征的工作，耗时很多。

工业界最多的解决的是分类问题。

线性回归不适合做分类，不够坚定，受噪声影响大。

用得到的y值划定阈值来分类

逻辑回归：把负无穷到正无穷压缩到0～1之间（可以看作概率域分布）

常用sigmoid函数映射

把线性回归转变成分类问题，找出一条判定边界

线性的判定边界
查看全文

相关阅读:
把arguments转化成数组
 最小化重绘和重排
 选择器API
事件委托
 WAhaha_hnu (zoj 2010 oct月赛)
素数计数公式全面拉丁化改写小有改进Meissel公式梅塞尔Lehmer公式莱梅=勒梅尔筛法三种形式孟庆余公式(转载)
NBUT 2013 Timed NOJ Training #005
2013 腾讯马拉松初赛第一场
 hrboj 1683 树形DP
哈尔滨2013校赛训练赛 4 解题思路

原文地址：https://www.cnblogs.com/vincentqliu/p/regression.html

Copyright © 2011-2022 走看看