zoukankan      html  css  js  c++  java
  • 吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法

    Q1代价函数

    (1)假设神经网络的训练样本有m个,每一个包含一组输入x和一组输出信号y,L表示神经网络的层数,Sl表示每一层的神经元个数,SL代表最后一层中处理单元的个数。

    则代价函数为(同样不对θ0正则化):

    Q2反向传播算法

    误差计算公式,注意第一列作为输入是没有误差的。

    前向传播算法:

    用δ表示误差,则δ(4)=a(4)-y

    前一层的误差为:

    再前一层的误差为:

    输入层不存在误差。

    每一层有了误差之后,即可分别进行求偏导,然后更新θ。

    Q3反向传播算法的直观理解

    误差值的计算则是从后向前计算,并且偏置误差可以不算,作为常数,对于求导没有影响。

    Q4实现注意:展开参数

    参数不再是向量而是矩阵

    Q5梯度检验

    http://dy.163.com/v2/article/detail/DHCUPPTC0511FERQ.html

    用某点领域的两个点的连线的斜率作为该点的估算值,然后用该值与神经网络计算出来的值作比较。

    Q6随机初始化

    参数的初始化应该随机的,如果是相同的值的话,第二层的所有激活单元都会有相同的值,后面也类似。

    Q7综合起来

    使用神经网络时的步骤:

    (1)网络结构:第一件要做的事是选择网络结构,即决定选择多少层以及决定每层分别有多少单元。

    第一层的单元数即为我们训练集的特征数量。

    最后一层的单元数是我们训练集的结果的类的数量。

    (2)训练神经网络:

    1.参数的随机初始化;(一般很小接近于0)

    2.利用正向传播方法计算所有的hθ(x);

    3.编写计算代价函数J的代码;

    4.利用反向传播方法计算所有的偏导数;

    5.利用数值检验方法得到的偏导数取检验这些偏导数,如果差别很小,则说明神经网络合理性;

    6.使用优化算法(梯度下降)来最小化代价函数(反向传播算法可以计算出下降的方向,梯度下降算法则沿着该方向进行下降)。

     

  • 相关阅读:
    poj 1087 A Plug for UNIX
    poj 1149 : PIGS
    自己制作的我们学校的校园无线网自动登录程序(C#实现)
    poj 1067取石子(威佐夫博奕)
    poj 1088滑雪
    SQL Server 2005 系统数据介绍:sys.dm_exec_requests
    一票难求:我为铁道部献计献策!
    Integration Services 学习(7):包部署
    Integration Services 学习(8):事务
    Integration Services包部署常见问题汇总
  • 原文地址:https://www.cnblogs.com/henuliulei/p/11273227.html
Copyright © 2011-2022 走看看