zoukankan      html  css  js  c++  java
  • 可视化和解释的11种基本神经网络架构 标准,循环,卷积和自动编码器网络

    随着深度学习的飞速发展,已经创建了整个神经网络架构,以解决各种各样的任务和问题。尽管存在无数的神经网络架构,但对于任何深度学习工程师来说,这里有11种必不可少的知识,它们分为四大类:标准网络,递归网络,卷积网络和自动编码器。

    标准网络

    1 | 感知器

    感知器是所有神经网络中最基础的,是更复杂的神经网络的基本构建块。它仅连接输入单元和输出单元。

     

    2 | 前馈网络

    前馈网络是感知器的集合,其中存在三种基本类型的层-输入层,隐藏层和输出层。在每次连接期间,来自上一层的信号乘以权重,加到偏置上,并通过激活函数。前馈网络使用反向传播来迭代更新参数,直到达到理想的性能为止。

     

    3 | 残留网络(ResNet)

    深度前馈神经网络的一个问题称为消失梯度问题,即当网络太长而无法在整个网络中反向传播有用信息时。随着更新参数的信号通过网络传播,它逐渐减小,直到网络前端的权重完全没有改变或被利用为止。

     

    循环网络

    4 | 递归神经网络(RNN)

    反复出现的神经网络是一种特殊类型的网络,它包含循环,并再次出现在自身,故名“复发”RNN允许将信息存储在网络中,使用先前训练中的推理来做出有关即将发生的事件的更好,更明智的决策。为此,它将先前的预测用作“上下文信号”。由于其性质,RNN通常用于处理顺序任务,例如逐字母生成文本或预测时间序列数据(例如股票价格)。他们还可以处理任何大小的输入。

     

    两种RNN可视化方法。

    5 | 长期短期记忆网络(LSTM)

    RNN存在问题,因为实际上上下文信息的范围非常有限。给定输入对隐藏层上的输入(因此对网络的输出)的影响(反向传播的误差)要么呈指数级增长,要么在网络连接周围循环时变为零。解决这个逐渐消失的梯度问题的方法是使用长短期内存网络或LSTM。

     

    6 | 回声状态网(ESN)

    回声状态网络是循环神经网络的一种变体,具有非常稀疏的连接的隐藏层(通常为百分之一的连接性)。神经元的连通性和权重是随机分配的,并且忽略层和神经元的差异(跳过连接)。学习输出神经元的权重,使网络可以产生和再现特定的时间模式。该网络背后的理由来自这样一个事实:尽管它是非线性的,但训练过程中唯一修改的权重是突触连接,因此可以将误差函数区分为线性系统。

     

    卷积网络

    7 | 卷积神经网络(CNN)

    图像具有很高的维数,因此训练一个标准的前馈网络来识别图像将需要成千上万的输入神经元,除了公然高昂的计算费用外,还可能引起许多与神经网络的维数诅咒相关的问题。卷积神经网络(CNN)通过使用卷积层和池化层来帮助降低图像的维数,从而提供了解决方案。由于卷积层是可训练的,但是比标准隐藏层具有更少的参数,因此它能够突出显示图像的重要部分并将它们向前传递。传统上,在CNN中,最后几层是隐藏层,它们处理“压缩图像信息”。

     

    8 | 反卷积神经网络(DNN)

    顾名思义,反卷积神经网络的作用与卷积神经网络相反。DNN不是执行卷积来减小图像的维数,而是利用反卷积来创建图像,通常是根据噪声来进行的。这是一项固有的艰巨任务。考虑CNN的任务是为奥威尔(Orwell)1984年的整本书编写三句摘要,而DNN的任务是从三句结构编写完整的书。

     

    9 | 生成对抗网络(GAN)

    生成对抗网络是一种专门设计用于生成图像的特殊类型的网络,它由两个网络组成:鉴别器和生成器。辨别器的任务是区分是从数据集中提取图像还是由生成器生成图像,生成器的任务是生成足够令人信服的图像,以使辨别器无法区分图像是否真实。

     

    发电机图。

    自动编码器

    10 | 自动编码器(AE)

    自动编码器的基本思想是获取原始的高维数据,将其“压缩”为高度信息化的低维数据,然后将压缩后的形式投影到新的空间中。自动编码器有许多应用,包括降维,图像压缩,去噪数据,特征提取,图像生成和推荐系统。它既可以作为无监督方法,也可以作为有监督方法,对于数据的性质可以非常有见地。

     

    11 | 可变自动编码器(VAE)

    自动编码器学习输入的压缩表示形式,例如可以是图像或文本序列,方法是压缩输入然后将其解压缩以匹配原始输入,而变分自动编码器(VAE)学习概率分布的参数代表数据。它不仅仅是学习表示数据的函数,还获得了更详细,细致的数据视图,从分布中采样并生成新的输入数据样本。从这个意义上讲,它更像是纯粹的“生成”模型,例如GAN。

     
  • 相关阅读:
    C# 获取文件的修改时间、访问时间、创建时间
    Nhibernate Or多条件查询
    C# 将GridView当前页数据导成Execl
    C# 清空文件夹
    TreeView默认收缩
    JS控制控件的隐藏显示
    div置顶,不随滚动条滚动而滚动
    js 父窗体与子窗体的调用
    树形菜单的绑定以及链接
    2010.10.16 OA项目组一周报告 CQ
  • 原文地址:https://www.cnblogs.com/dr-xsh/p/13211918.html
Copyright © 2011-2022 走看看