zoukankan      html  css  js  c++  java
  • Tensorflow笔记:反向传播,搭建神经网络的八股,(损失函数loss,均方误差MSE,反向传播训练方法,学习率)

    一、反向传播 
    反向传播:训练模型参数,在所有参数上用梯度下降,使 NN 模型在训练数据上的损失函数最小。 


    损失函数(loss):计算得到的预测值 y 与已知答案 y_的差距。 
    损失函数的计算有很多方法,均方误差 MSE 是比较常用的方法之一。

     
    均方误差 MSE:求前向传播计算结果与已知答案之差的平方再求平均。 
     
    用 tensorflow 函数表示为: 

    loss_mse = tf.reduce_mean(tf.square(y_ - y)) 


    反向传播训练方法:以减小 loss 值为优化目标,有梯度下降momentum 优化器adam 优化器等优化方法。 
    这三种优化方法用 tensorflow 的函数可以表示为: 

    train_step=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss) 
    train_step=tf.train.MomentumOptimizer(learning_rate, momentum).minimize(loss) 
    train_step=tf.train.AdamOptimizer(learning_rate).minimize(loss) 


    三种优化方法区别如下: 
    tf.train.GradientDescentOptimizer()使用随机梯度下降算法,使参数沿着梯度的反方向,即总损失减小的方向移动,实现更新参数。 

    参数更新公式是 
     


    其中,?(?)为损失函数,?为参数,?为学习率。 
    tf.train.MomentumOptimizer()在更新参数时,利用了超参数,参数更新公式
    是 
    ?? = ???−1 + ?(??−1) 
    ?? = ??−1 − ??? 
    其中,?为学习率,超参数为?,?为参数,?(??−1)为损失函数的梯度。 


    tf.train.AdamOptimizer()是利用自适应学习率的优化算法,Adam 算法和随机梯度下降算法不同。随机梯度下降算法保持单一的学习率更新所有的参数,学习率在训练过程中并不会改变。而 Adam 算法通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。 

    学习率:决定每次参数更新的幅度。 优化器中都需要一个叫做学习率的参数,使用时,如果学习率选择过大会出现震荡不收敛的情况,如果学习率选择过小,会出现收敛速度慢的情况。我们可以选个比较小的值填入,比如 0.01、0.001。 


    二、搭建神经网络的八股 
    我们最后梳理出神经网络搭建的八股,神经网络的搭建课分四步完成:准备工作、前向传播、反向传播和循环迭代。 
    0.导入模块,生成模拟数据集; 
                    import 
                    常量定义 
                    生成数据集     
    1.前向传播:定义输入、参数和输出 
                     x=        y_= 
                     w1=       w2= 
                     a=        y= 
    2. 反向传播:定义损失函数、反向传播方法 
    loss= 
    train_step= 


    3. 生成会话,训练 STEPS 轮 
     

    with tf.session() as sess 
     Init_op=tf. global_variables_initializer() 
     sess_run(init_op) 
     STEPS=3000 
     for i in range(STEPS): 
      start= 
      end= 
      sess.run(train_step, feed_dict:) 
  • 相关阅读:
    自定义TextInput中displayAsPassword的字符
    C#序列化与反序列化代码记录
    解决Discuz!NT"Code: 100, Message: 指定..."问题
    如何在asp.net项目开发的验证码图片和打印中区别0和O(零和字母O)
    "淘宝开放平台"可以成为程序员的摇钱树吗?
    Discuz!NT与asp.net整合集成实例教程
    最震撼的大片《2012》世界末日 电影 高画质 超DVD版清晰效果 在线视频播
    划时代的感人大片!《机器人总动员》(WALL.E) 在线播放
    从数据库某表转换并导入数据到另一表
    界面原型设计工具选择报告
  • 原文地址:https://www.cnblogs.com/Romantic-Chopin/p/12451050.html
Copyright © 2011-2022 走看看