LR(对数几率回归)
函数为(y=f(x)=frac{1}{1+e^{-(w^{T}x+b)}})。 由于输出的是概率值(p(y=1|x)=frac{e^{w^{T}x+b}}{1+e^{w^{T}x+b}},p(y=0|x)=frac{1}{1+e^{w^{T}x+b}}),所以求解使用极大似然估计来求解参数(w,b)。
为了方便表示,记(widehat{w}=(w;b),widehat{x}=(x;1))
写出似然函数$$prod_{i=1}{m}p(y=1|widehat{x}_{i},widehat{w}){y_{i}}p(y=0|widehat{x}{i},widehat{w})^{1-y{i}}$$
对数似然函数$$ l(widehat{w})=sum_{i=1}^{m}y_{i}ln p(y=1|widehat{x}{i},widehat{w})+(1-y{i})ln p(y=0|widehat{x}_{i},widehat{w})$$
[l(widehat{w})=sum_{i=1}^{m}y_{i}(widehat{w}^{T}widehat{x}_{i})-ln (1+e^{widehat{w}^{T}widehat{x}_{i}})
]
要让每个样本属于其真实值的概率越大越好,故对(-l(widehat{w}))最小化,由于(l(widehat{w}))是关于(widehat{w})的高阶可导连续函数,可用梯度下降法和牛顿法求解,最优解为$$widehat{w}^{*}=underset{widehat{w}}{arg min}-l(widehat{w})$$