1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归是机器学习中的一种分类模型,逻辑回归是一种二分类算法,虽然名字中带有回归,与回归之间有一定的联系,但不是回归算法。
逻辑回归的数学表达模型:
逻辑回归模型是具有一定数量的固定数量参数的模型,这取决于输入特征的数量。逻辑回归是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。
逻辑回归与线性回归对比的不同:
逻辑回归对变量分布没有要求,但是要求因变量是分类型变量,同时不要求自变量和因变量呈线性关系。逻辑回归是分析因变量取某个值的概率与自变量的关系。
逻辑回归最大的特点就是将函数值收缩到[0,1]这个范围。
2.自述一下什么是过拟合和欠拟合?
欠拟合:是指模型在训练集、验证集和测试集上均表现不佳的情况。根本原因是特征维度过少,导致拟合的函数无法满足训练集,误差较大;解决方法:增加特征维度;
过拟合:简单理解就是训练样本的得到的输出和期望输出基本一致,但是样本输出和测试样本的期望输出相差却很大 。根本原因是特征维度过大,导致拟合的函数完美的经过训练集,但对新数据的预测结果差。
3.思考一下逻辑回归的应用场景有哪些?
逻辑回归的应用场景:
广告点击率:通过分析需求方和用户方的信息,对广告点击率进行预测。
是否为垃圾邮件:通过分析邮件的信息,判断这份邮件是否为垃圾邮件。
金融诈骗:通过正常行为和诈骗行为的操作进行分析,预测出此行为是否为金融诈骗。