UFLDL教程（四）之Softmax回归

zoukankan html css js c++ java

UFLDL教程（四）之Softmax回归

关于Andrew Ng的machine learning课程中，有一章专门讲解逻辑回归（Logistic回归），具体课程笔记见另一篇文章。

下面，对Logistic回归做一个简单的小结：

给定一个待分类样本x，利用Logistic回归模型判断该输入样本的类别，需要做的就是如下两步：

① 计算逻辑回归假设函数的取值hθ(x)，其中n是样本的特征维度

② 如果hθ(x)>=0.5，则x输入正类，否则，x属于负类

或者直接利用判别边界进行判断，即：如果θ'x>=0，则x输入正类，否则，x属于负类

所以，Logistic回归只能解决两类分类问题。

************************

这里一个很重要的问题就是，在对待分类样本进行分类之前，需要利用训练样本对该逻辑回归模型的参数θ=[θ1, θ2, ..., θn]进行求解

最优化的模型参数就是使代价函数取得最小值的参数，所以，只要利用优化，找到使得代价函数具有最小值的参数即可。

（1）给定参数theta的初始值

（2）利用函数fminunc对代价函数进行优化，求得最优化的theta值

该函数要求输入theta的初始值、梯度和代价函数的计算函数、其他设置

（3）得到最优化的theta值后，对于某一个待分类样本，计算它的假设函数取值或者是判定边界的取值，从而可以对其分类进行判别

************************

下面开始是softmax回归问题

第0步：初始化参数

①样本特征维数n (inputSize)

②样本类别数k (numClasses)

③衰减项权重 (lambda)

第一步：载人MNIST数据集

① 载入MNIST数据集

② 载入MNIST数据集的标签

在标签集中，标签0表示数字0，为了后续处理方便，将数字0的标签改为10

注1：实验中，有时为了调试方便，在调试时，可以加入合成数据；

注2：程序文件夹中，为了分类方便，将MNIST数据集和MNIST数据集的操作函数都存放在MNIST文件夹中，在使用前，加入语句addpath mnist/即可；

随机产生参数theta的初始值

它的维数是k*n，k是类别数numClasses，n是输入样本的特征维数inputSize

第二步：编写softmax函数

该函数的作用是计算代价函数及代价函数的梯度

（1）计算代价函数

① 代价函数的计算公式如下：

② 程序中的向量化计算方法如下:

(2) 计算梯度

① 梯度的计算公式如下：

② 程序中向量化计算方法如下：

第三步：梯度检验

在首次编写完softmax函数后，要利用梯度检验算法，验证编写的softmaxCost函数是否正确；直接调用checkNumericalCradient函数

第四步：利用训练样本集学习Softmax的回归参数

第五步：对于某一个待分类样本，利用求得的softmax回归模型对其进行分类

******关于向量化的程序公式的推导******

（1）已知参数的形式

① 参数θ的形式

② 输入数据x的形式

③ θx的乘积形式，记为矩阵M

（2）单个样本的成本函数

① 单个样本的成本函数

即：

② 单个样本的假设函数

但实际中，为了不会出现计算上的溢出，需要对假设函数的每一项都做如下调整

其中：

则有：

（3）m个样本的成本函数

① m个样本的成本函数

② m个样本的假设函数

其中：

(4) 计算梯度

① 单个样本的梯度计算

注1：

注2：

② m个样本梯度的计算

则有：

******按照神经网络的形式理解softmax模型******

（1）softmax模型，可以以神经网路的形式绘制，如下图所示

可以看到，softmax模型与传统的神经网络相比，只是输出层所使用的函数发生了变化：softmax模型使用的是指数函数，而神经网络使用的是sigmoid函数；

------------------------------------------------------------------------------------------------------------------------------- 博主为菜鸟一枚，发表博客的主要目的是为了记录科研中的点滴，方便自己以后查阅，如果有错误的地方，还请大家多提宝贵意见，如果有何侵犯到其他博主的内容，还请告知博主，将会及时处理！另外，对于未标注转载的文章，均为博主自己整理，如需转载，请注明出处，谢谢！

查看全文

相关阅读:
webpack入门
 Javascript隐式转换
 一个最小手势库的实现
 运用JS设置cookie、读取cookie、删除cookie
不同浏览器下兼容文本两端对齐
 使用CSS3实现一个3D相册
 JavaScript 火的有点过头了，但又能火多久呢？
强大的css3
CSS3与页面布局学习总结
 红米手机真机调试问题记录

原文地址：https://www.cnblogs.com/lutingting/p/4768882.html