1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
(1)逻辑回归是机器学习中的一种分类模型,在线性回归的基础上,套用了一个逻辑函数Logistic函数(logistic function),用于估计某种事物的可能性。
(2)区别:a.线性回归是计算出具体的值,是解决回归问题;逻辑回归是给出是和否,解决的是分类问题。
b.逻辑回归引入了sigmoid函数,把y值从线性回归的(−∞,+∞)限制到了(0,1)的范围。
c.逻辑回归通过阈值判断的方式,引入了非线性因素,可以处理分类问题。
2.自述一下什么是过拟合和欠拟合?
(1)过拟合: 是在模型参数拟合过程中的问题,由于训练数据包含抽样误差,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合;在训练数据上表现良好,模型训练误差很低,但是在测试集上表现差。
(2)欠拟合:就是学习器没有很好地学到训练样本的一般性质,不能够很好地拟合数据,所以不论在训练数据还是测试数据中表现都很差。
3.思考一下逻辑回归的应用场景有哪些?
(1)垃圾邮件分类
(2)预测期末考试能否及格
(3)挖掘引发疾病的主要因素