regression与线性回归(linear regression)
线性回归(linear regression):
- 有监督学习 => 学习样本为D={(xi,yi)}ª
- 输出/预测的结果yi为连续值变量
- 需要学习映射f:x~y
- 假定输入x和输出y之间有线性相关关系
损失函数(loss function)
我们要找到最好的权重/参数Θ
怎么去衡量“最好”? 定义损失函数
最小化损失函数 梯度下降(Gradient descend)
逐步最小化损失函数的过程
如同下山,找准方向(斜率),每次迈进一小步,直至山底
找到合适的学习率(步长),再进行训练,否则特征多,样本的多的情况下成本会很大的。
数学和工程区别是工程找到大致可用的就可以了,数学是找打最优解。
特征的工作,耗时很多。
工业界最多的解决的是分类问题。
线性回归不适合做分类,不够坚定,受噪声影响大。
用得到的y值划定阈值来分类
逻辑回归:把负无穷到正无穷压缩到0~1之间(可以看作概率域分布)
常用sigmoid函数映射
把线性回归转变成分类问题,找出一条判定边界
线性的判定边界