《神经网络和深度学习》系列文章十一：关于损失函数的两个假设

zoukankan html css js c++ java

《神经网络和深度学习》系列文章十一：关于损失函数的两个假设
出处： Michael Nielsen的《Neural Network and Deep Learning》，点击末尾“阅读原文”即可查看英文原文。

本节译者：哈工大SCIR本科生王宇轩

声明：我们将在每周一，周四定期连载该书的中文翻译，如需转载请联系wechat_editors@ir.hit.edu.cn，未经授权不得转载。
1. 使用神经网络识别手写数字
2. 反向传播算法是如何工作的
3. 改进神经网络的学习方法
4. 神经网络能够计算任意函数的视觉证明
5. 为什么深度神经网络的训练是困难的
6. 深度学习
反向传播算法的目标是计算代价函数C对神经网络中出现的所有权重w和偏置b的偏导数∂C/∂w和∂C/∂b。为了使反向传播工作，我们需要对代价函数的结构做两个主要假设。在进行假设之前，在脑海中有一个代价函数的实例是很有用的。我们将会使用上一章讲到的平方代价函数作为例子。上一章的平方代价函数具有以下形式：

其中n是训练样本总数；求和符号表示对每个独立训练样本x求和；y=y(x)是对应的希望输出；L是神经网络层数；a^L=a^L(x)是输入为x时激活函数的输出向量。

那么，为了能够使用反向传播算法，我们需要对代价函数C进行怎样的假设呢？第一条假设是代价函数能够被写成的形式，其中C_x是每个独立训练样本x的代价函数。在代价函数为平方代价函数的情况下，一个训练样本的代价是。该假设对于本书中涉及到的其它所有代价函数都成立。

我们需要上述假设的原因是，反向传播实际上是对单个训练数据计算偏导数∂C_x/∂w和∂C_x/∂b。然后通过对所有训练样本求平均值获得∂C/∂w和∂C/∂b。事实上，有了这个假设，我们可以认为训练样本x是固定的，然后把代价C_x去掉下标表示为C。最终我们会重新把x加回公式，但目前为了简便我们将它隐去。我们对代价函数做的第二条假设是它可以写成关于神经网络输出结果的函数：

平方代价函数满足该要求，因为单一训练样本x的二次代价可以表示为：

这是一个关于输出激活值的函数。显然，该代价函数也依赖于期望的输出y，所以你可能疑惑为什么我们不把代价视为关于y的函数。记住，输入的训练样本x是固定的，因此期望的输出y也是固定的。需要注意，我们不能通过改变权值或偏置来修改它，换句话说，它不是神经网络所学习的东西。所以把C视为只关于输出a^L的函数是有道理的。在该函数中y只是帮助定义函数的参数。

下一节我们将介绍“Handmard积，s⊙t”，敬请关注！
查看全文

相关阅读:
pycharm中将文件目录标记为sources root和sys.path.append()效果一样
 简单的股票信息查询系统 1 程序启动后，给用户提供查询接口，允许用户重复查股票行情信息(用到循环) 2 允许用户通过模糊查询股票名，比如输入“啤酒”, 就把所有股票名称中包含“啤酒”的信息打印出来 3 允许按股票价格、涨跌幅、换手率这几列来筛选信息，比如输入“价格>50”则把价格大于50的股票都打印，输入“市盈率<50“，则把市盈率小于50的股票都打印，不用判断等于。
添加jar到本地maven库
 jquery.qrcode中文乱码的解决终极办法
 easyUI datagrid view扩展
 CANNOT READ PROPERTY ‘opera’ OF UNDEFINED解决方法
 关于 Promise 的一些简单理解
 Java 内功修炼之数据结构与算法（一）
学习一下 JVM （三） -- 了解一下垃圾回收
 学习一下 JVM （二） -- 学习一下 JVM 中对象、String 相关知识

原文地址：https://www.cnblogs.com/sdlypyzq/p/4971339.html