zoukankan      html  css  js  c++  java
  • 《强化学习精要 核心算法与TensorFlow实现》【1】

     

     

      

     

     

     

     

      

     

     

     

     

     

     -->

    不一定要沿梯度方向下降?

    通过不同的方向 来探测/估计当前地形?

    -->

    如何衡量 zigzig 的程度——如果从历史的迭代中学习掌握规律?

    --> 

    动量方法 --> 数据驱动~ 每个方向算一个偏导数,根据偏导数来决定当前的方向

    步长呢?——可以动量方法一把?dogleg 方法试探性地步长减半?

     

     

     

     

      

     

     

     

     

     

     

    Fisher 信息阵 = KL散度的二阶导

    --> log f(x) 的二阶导,求期望,到底是个何方神圣

  • 相关阅读:
    [转载] 常用CASE工具介绍
    GridView, DataGrid 中,DataFormatString语法汇总
    [轉]SQL Server中数据类型详解
    强烈推荐asp.net数据访问的官方指南系列 (Data Access Tutorials)
    实现iFrame自适应高度,原来很简单!
    [转]Web service到底是什么?在什么情况下,你应该使用web service
    贴一个查询SQL Server数据库中所有表及其描述(Description)的SQL语句
    C#中,String和string的区别
    ERWin 连接SQL Sever2005的问题
    [转载]ERwin相关概念入门
  • 原文地址:https://www.cnblogs.com/cx2016/p/13168993.html
Copyright © 2011-2022 走看看