1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归:
逻辑回归用于分类,而不是回归。
在线性回归模型中,输出一般是连续的, 对于每一个输入的x,都有一个对应的输出y。因此模型的定义域和值域都可以是无穷。
但是对于逻辑回归,输入可以是连续的[-∞, +∞],但输出一般是离散的,通常只有两个值{0, 1}。
这两个值可以表示对样本的某种分类,高/低、患病/ 健康、阴性/阳性等,这就是最常见的二分类逻辑回归。因此,从整体上来说,通过逻辑回归模型,我们将在整个实数范围上的x映射到了有限个点上,这样就实现了对x的分类。因为每次拿过来一个x,经过逻辑回归分析,就可以将它归入某一类y中。
对比:
逻辑回归采用似然函数,而不是平方损失函数
2.自述一下什么是过拟合和欠拟合?
过拟合:
指一个假设在训练数据上能够获得比其他假设更好的拟合(训练误差小)但是在训练数据外的数据集上却不能很好的拟合数据(测试误差大)。此时模型的泛化能力较差,不利于推广。
欠拟合:
即回归问题线性拟合较差,分类问题则分类较差。
3.思考一下逻辑回归的应用场景有哪些?
通过属性来判断产品的好坏,比如:芒果的酸甜