1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
线性回归:
线性回归是一种回归分析技术.回归分析就是利用样本(已知数据),产生拟合方程,从而对未知数据进行预测,回归在于分析自变量与因变量之间的关系。线性回归属于有监督学习,因此方法和监督学习应该是一样的,先给定一个训练集,根据这个训练集学习出一个线性函数,然后测试这个函数训练的好不好,挑选出最好的函数即可
线性回归函数:y = ax + b, 其中a和b是待求参数。逻辑回归:函数p = S(ax + b), 其中a和b是待求参数, S是逻辑斯蒂函数,然后根据p与1-p的大小确定输出的值,通常阈值取0.5,若p大于0.5则归为1这类。
可以认为逻辑回归的输入是线性回归的输出,将逻辑斯蒂函数作用于线性回归的输出得到输出结果。
线性回归与逻辑回归最大的区别就在于他们的因变量不同。
2.自述一下什么是过拟合和欠拟合?
欠拟合的根本的原因是特征维度过少,导致拟合的函数无法满足训练集,误差较大。可以通过增加特征维度来解决。
过拟合根本的原因则是特征维度过多,导致拟合的函数完美的经过训练集,但是对新数据的预测结果则较差。可以减少特征维度; 人工选择保留的特征,或者模型选择算法解决。或者将数据正则化; 保留所有的特征,通过降低参数θ的值。
3.思考一下逻辑回归的应用场景有哪些?
(1)预测事件发生概率
(2)预测某个地方发病情况
(3)预测股票跌涨