zoukankan      html  css  js  c++  java
  • NEAT算法

    NEAT算法是相对提出较早的算法,在2013年大名鼎鼎的DeepMind提出了一种深度增强学习的算法,该算法主要结合的CNN和Q-Learning两种算法,本质利用遗传算法创建神经网络

    1、RL:增强学习

    奖赏假设 :

     任务的目标可以等价的表示为在某个奖赏函数上的累积最大化
    马尔可夫性:当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态;换句话说,在给定现在状态时,它与过去状态(即该过程的历史路径)是条件独立的,那么此随机过程即具有马尔可夫性质。具有马尔可夫性质的过程通常称之为马尔可夫过程。

    (2)Q学习

    基本迭代:

    2、NEAT算法即通过增强拓扑的进化神经网络(Evolving Neural Networks through Augmenting Topologies),算法不同于我们之前讨论的传统神经网络,它不仅会训练和修改网络的权值,同时会修改网络的拓扑结构,包括新增节点和删除节点等操作。

    NEAT算法几个核心的概念是:

    • 基因:网络中的连接
    • 基因组:基因的集合
    • 物种:一批具有相似性基因组的集合
    • Fitness:有点类似于增强学习中的reward函数
    • generation:进行一组训练的基因组集合,每一代训练结束后,会根据fitness淘汰基因组,并且通过无性繁殖和有性繁殖来新增新的基因组
    • 基因变异:发生在新生成基因组的过程中,可能会出现改变网络的权重,增加突出连接或者神经元,也有可能禁用突触或者启用突触

    下图我们展示了算法从最一开始简单的神经网络,一直训练到后期的网络

  • 相关阅读:
    18款 非常实用 jquery幻灯片图片切换
    6款强大的 jQuery 网页布局创建及优化插件
    18 个最新实用的 jQuery 插件
    jQuery中的编程范式
    JQuery _ 定时器(jQuery Timers) 学习
    21个最佳jQuery插件推荐
    7 款基于 JavaScript/AJAX 的文件上传插件
    C#
    kernel 3.10内核源码分析--hung task机制
    进程的虚拟地址空间
  • 原文地址:https://www.cnblogs.com/6530265oule/p/9732578.html
Copyright © 2011-2022 走看看