机器学习-softmax回归 python实现

zoukankan html css js c++ java

机器学习-softmax回归 python实现
---恢复内容开始---

Softmax Regression 可以看做是 LR 算法在多分类上的推广，即类标签 y 的取值大于或者等于 2。

假设数据样本集为：$left { left ( X^{(1)},y ^{(1)} ight ) ,left ( X^{(2)},y ^{(2)} ight ),left ( X^{(3)},y ^{(3)} ight ),...,left ( X^{(m)},y ^{(m)} ight ) ight }$

对于 SR 算法，其输入特征为：$ X^{(i)} in mathbb{R}^{n+1}$，类别标记为：$y^{(i)} in { 0,1,2,...,k }$，假设函数为每一个样本估计其所属类别的概率 $P(y=j|X)$，具体的假设函数为：

$h_{ heta}(X^{(i)}) =egin{bmatrix}
P(y^{(i)}=1|X^{(i)}; heta)\
P(y^{(i)}=2|X^{(i)}; heta)\
...\
P(y^{(i)}=k|X^{(i)}; heta)
end{bmatrix} = frac{1}{sum _{j=1}^{k}e^{ heta_j^TX^{(i)}}}egin{bmatrix}
e^{ heta_1^TX^{(i)}}\
e^{ heta_2^TX^{(i)}}\
...\
e^{ heta_k^TX^{(i)}}
end{bmatrix}$

其中，$ heta$表示的向量，且 $ heta_i in mathbb{R}^{n+1}$，则对于每一个样本估计其所属的类别的概率为

$P(y^{(i)}=j|X^{(i)}; heta) = frac{e^{ heta_j^TX^{(i)}}}{sum _{l=1}^{k}e^{ heta_l^TX^{(i)}}}$

SR 的损失函数为：

$J( heta) = -frac{1}{m} left [sum_{i=1}^{m} sum_{j=1}^{k} I { y^{(i)}=j } log frac{e^{ heta_j^TX^{(i)}}}{sum _{l=1}^{k}e^{ heta_l^TX^{(i)}}} ight ]$

其中，$I(x) = left{egin{matrix}
0 & if;;x = false\
1 & if;;x = true
end{matrix} ight.$ 表示指示函数。

对于上述的损失函数，可以使用梯度下降法求解：

首先求参数的梯度：

$frac{partial J( heta )}{partial heta _j} = -frac{1}{m}left [ sum_{i=1}^{m} riangledown _{ heta_j}left { sum_{j=1}^{k}I(y^{(i)}=j) logfrac{e^{ heta_j^TX^{(i)}}}{sum _{l=1}^{k}e^{ heta_l^TX^{(i)}}} ight } ight ]$

当 $y^{(i)}=j$ 时， $frac{partial J( heta )}{partial heta _j} = -frac{1}{m}sum_{i=1}^{m}left [left ( 1-frac{e^{ heta_j^TX^{(i)}}}{sum _{l=1}^{k}e^{ heta_l^TX^{(i)}}} ight )X^{(i)} ight ]$

当 $y^{(i)} eq j$ 时，$frac{partial J( heta )}{partial heta _j} = -frac{1}{m}sum_{i=1}^{m}left [left (-frac{e^{ heta_j^TX^{(i)}}}{sum _{l=1}^{k}e^{ heta_l^TX^{(i)}}} ight )X^{(i)} ight ]$

因此，最终结果为：

$g( heta_j) = frac{partial J( heta )}{partial heta _j} = -frac{1}{m}sum_{i=1}^{m}left [X^{(i)} cdot left ( Ileft { y^{(i)}=j ight }-P( y^{(i)}=j|X^{(i)}; heta) ight ) ight ]$

梯度下降法的迭代更新公式为：

$ heta_j = heta_j - alpha cdot g( heta_j)$

主要python代码
def gradientAscent(feature_data,label_data,k,maxCycle,alpha): ''' 梯度下降求解Softmax模型 :param feature_data: 特征 :param label_data: 标签 :param k: 类别个数 :param maxCycle: 最大迭代次数 :param alpha: 学习率 :return: 权重 ''' m,n = np.shape(feature_data) weights = np.mat(np.ones((n,k))) #一共有n*k个权值 i = 0 while i <=maxCycle: i+=1 err = np.exp(feature_data*weights) #e^( heta_j * x^i) if i%100==0: print (" -----iter:",i,",cost:",cost(err,label_data)) rowsum = -err.sum(axis = 1) rowsum = rowsum.repeat(k,axis = 1) err = err/rowsum # -p(y^i = j|x^i;0) for x in range(m): err[x,label_data[x,0]]+=1 # I(y^i = j)-p(y^i = j|x^i;0) weights = weights+(alpha/m)*feature_data.T*err #weights return weights

View Code
def cost(err,label_data): ''' 计算损失函数值 :param err: exp的值 :param label_data: 标签值 :return: sum_cost/m:损失函数值 ''' m = np.shape(err)[0] sum_cost = 0.0 for i in xrange(m): if err[i,label_data[i,0]] / np.sum(err[i,:])>0: sum_cost -=np.log(err[i,label_data[i,0]]/np.sum(err[i,:])) else: sum_cost-=0 return sum_cost/m

View Code
Sklearn代码：
lr = LogisticRegressionCV(fit_intercept=True, Cs=np.logspace(-5, 1, 100), multi_class='multinomial', penalty='l2', solver='lbfgs',max_iter = 10000,cv = 7)#multinomial表示多类即softmax回归 re = lr.fit(X_train, Y_train)

View Code
查看全文

相关阅读:
WinCE 手机互联
 Android 之 getSharedPreferences 和 getPreferences
Android 之 ListView 点击响应代码？
Android 之 selector
昨天晚上被 Android 手机上的广告程序折磨了
 今天终于将第一个 Android NDK 程序编译、运行成功
 Android 4.0.1 源代码编译
 The connection to adb is down, and a severe error has occured.
成绩转换
 兄弟郊游问题

原文地址：https://www.cnblogs.com/wzhao-cn/p/11315510.html