逻辑斯谛回归模型
- 逻辑斯谛分布
定义 :设X是连续随机变量,X服从逻辑斯谛分布是指X具有下列分布函数和密度函数:
上式中u为位置参数,r>0为形状参数。
下图是他的概率密度函数图像和函数图像
有些同学对逻辑斯谛回归不了解的可能以为它是回归模型,其实不是,它是分类模型,而且是概率模型,往往逻辑斯谛回归模型用来解决二分类问题,不过它也有处理多分类问题的推广。
二项逻辑斯谛回归模型则用于解决二分类问题,其条件分布符合下式
w.x是w和x的内积。我们通过训练集结合模型训练的是w和b,来尽量的拟合我们的数据集。
得到其损失函数为:
上式如何来的呢?
其实我们分别取yi=0和yi=1代入就知道了,这其实抽象化理解就是对于整个数据集,从整体考虑,考虑到每个样本,我们希望如果yi=1那么p(Y=1)的概率尽可能大,如果yi=0,那么p(Y=0)的概率尽可能大,同时针对整个数据集,每个样本都有自己的独立性,所有样本同时发生相当于一个事件,我们应找到一个概率模型使这个事件发生概率最大化,即所有样本发生的联合概率最大化,因为每个样本独立,所以即最小化每个样本概率积的损失函数。