zoukankan      html  css  js  c++  java
  • keras 中的一点问题

    TimeDistributed层在Keras中的作用是什么?

    我试图了解TimeDistributed包装器在Keras中的作用。

    我得到TimeDistributed“将一个图层应用于输入的每个时间片。”

    但我做了一些实验并得到了我无法理解的结果。

    简而言之,与LSTM层相关,TimeDistributed和Dense层具有相同的结果。

    model = Sequential()
    model.add(LSTM(5, input_shape = (10, 20), return_sequences = True))
    model.add(TimeDistributed(Dense(1)))
    print(model.output_shape)

    model = Sequential()
    model.add(LSTM(5, input_shape = (10, 20), return_sequences = True))
    model.add((Dense(1)))
    print(model.output_shape)
    对于这两种型号,我的输出形状为(无,10,1)。

    任何人都可以解释RNN层之后TimeDistributed和Dense层之间的区别吗?

    目前ssem没有区别,这里讨论它。我认为最初的意图是区分Dense平坦化输入然后重新整形的层,因此连接不同的时间步长并具有更多参数,并TimeDistributed保持时间步长分离(因此具有较少的参数)。在你的情况下Dense应该有500个参数,TimeDistributed只有50 - gionni 11月15日'17在13:00
    @gionni不,它有相同数量的参数(均为6)。那么atm几乎没有什么区别? - Buomsoo Kim 于17年11月16日凌晨2 点09分
    是的,如果存在差异,这些是他们将拥有的参数数量。目前没有 - gionni 于17年11月16日12:17

    在keras建立顺序模型时 - 通常是第二维(一个在样本维度之后) - 与time维度相关。这意味着,如果例如,你的数据是5-dim与(sample, time, width, length, channel)您可以应用使用卷积层TimeDistributed(其适用于4-dim与(sample, width, length, channel)以获得沿时间维度)(应用相同的层到每个时间片)5-d输出。

    这样的情况Dense是,keras从版本2.0开始Dense默认仅应用于最后一个维度(例如,如果您应用于Dense(10)具有形状的输入,(n, m, o, p)您将获得具有形状的输出(n, m, o, 10)),因此在您的情况下Dense并且TimeDistributed(Dense)是等效的。

  • 相关阅读:
    linux内存和swap
    Linux awk sort
    redis aof和rdb区别
    STL中的map、unordered_map、hash_map
    mysql 冷热备份
    redis
    linux 几个命令
    linux erase
    group by
    现在很多技术知识点缺乏来龙去脉的介绍
  • 原文地址:https://www.cnblogs.com/wdmx/p/9281960.html
Copyright © 2011-2022 走看看