zoukankan      html  css  js  c++  java
  • paddle中的LoDTensor

    简介

    LoDTensor是一个具有LoD(Level of Details)信息的张量(Tensor),可用于表示变长序列。

    LoDTensor可以通过 np.array(lod_tensor) 方法转换为numpy.ndarray。

    下面以两个例子说明如何用LoDTensor表示变长序列。

    示例

    示例1:

    假设x为一个表示变长序列的LoDTensor,它包含2个逻辑子序列,第一个序列长度是2(样本数量为2),第二个序列长度是3,总序列长度为5。 第一个序列的数据为[1, 2], [3, 4],第二个序列的数据为[5, 6], [7, 8], [9, 10],每个样本数据的维度均是2,该LoDTensor最终的shape为[5, 2],其中5为总序列长度,2为每个样本数据的维度。

    在逻辑上,我们可以用两种方式表示该变长序列,一种是递归序列长度的形式,即x.recursive_sequence_length = [[2, 3]];另一种是偏移量的形式,即x.lod = [[0, 2, 2+3]]。 这两种表示方式是等价的,您可以通过LoDTensor的相应接口来设置和获取recursive_sequence_length或LoD。

    在实现上,为了获得更快的序列访问速度,Paddle采用了偏移量的形式来存储不同的序列长度。因此,对recursive_sequence_length的操作最终将转换为对LoD的操作。

    x.data = [[1, 2], [3, 4],
              [5, 6], [7, 8], [9, 10]]
    
    x.shape = [5, 2]
    
    x.recursive_sequence_length = [[2, 3]]
    
    x.lod  =  [[0, 2, 5]]

     

    示例2:

    LoD可以有多个level(例如,一个段落可以有多个句子,一个句子可以有多个单词)。假设y为LoDTensor ,lod_level为2。从level=0来看有2个逻辑序列,序列长度分别为2和1,表示第一个逻辑序列包含2个子序列,第二个逻辑序列包含1个子序列。从level=1来看,第一个逻辑序列包含的2个子序列长度分别为2和2,第二个逻辑序列包含的1个子序列长度为3。

    因此,该LoDTensor以递归序列长度形式表示为 y.recursive_sequence_length = [[2, 1], [2, 2, 3]];相应地,以偏移量形式表示为 y.lod = [[0, 2, 3], [0, 2, 4, 7]]。

    y.data = [[1, 2], [3, 4],
              [5, 6], [7, 8],
              [9, 10], [11, 12], [13, 14]]
    
    y.shape = [2+2+3, 2]
    
    y.recursive_sequence_length = [[2, 1], [2, 2, 3]]
    
    y.lod = [[0, 2, 3], [0, 2, 4, 7]]

    示例代码

    具体解释看注释

    import paddle.fluid as fluid
    def loDTensor_test():
    
        a = fluid.create_lod_tensor(np.array([[1],[1],[1],
                                      [1],[1],
                                      [1],[1],[1],[1],
                                      [1],
                                      [1],[1],
                                      [1],[1],[1]]).astype('int64') ,
                              [[3,2,4,1,2,3]],
                              fluid.CPUPlace())
        # 2-level,第一个level指代一篇文章有多少个句子,第二个level表示一个句子有多少个单词
        b=fluid.create_lod_tensor(np.array([[1.], [3.], [2.], [4.], [6.], [5.], [1.]]).astype('float64') ,
                              [[2, 0, 3], [1, 2, 1, 0, 3]],
                              fluid.CPUPlace())
        c = fluid.create_lod_tensor(np.array([[1.], [3.], [2.], [4.], [6.], [5.], [1.]]).astype('float32'),
                                    [[2, 3, 2]],
                                    fluid.CPUPlace())
        # 查看lod-tensor嵌套层数
        print(len(b.recursive_sequence_lengths()))# 2
        print(b.lod())# [[0, 2, 2, 5], [0, 1, 3, 4, 4, 7]]
    
        # 查看lod-tensor嵌套层数
        print(len(c.recursive_sequence_lengths()))
        print(c.lod())#[[0, 2, 5, 7]]
    loDTensor_test()
  • 相关阅读:
    经典网页设计:漂亮的个人作品集网站设计欣赏【中篇】
    引领网页设计潮流的优秀网页作品赏析《第二季》
    Chance – 功能强大的 JavaScript 随机数生成类库
    设计前沿:16款扁平风格 iOS 7 图标设计
    TwentyTwenty – 使用 jQuery 实现图片对比功能
    未来的 Web:九个不可思议的 WebGL 应用试验
    推荐25个帮助你提高技能的 CSS3 实战教程
    经典网页设计:顶尖的个人作品集网站设计欣赏【上篇】
    Smint – 用于单页网站制作的 jQuery 导航菜单插件
    关注经典:CSS Awards 获奖网站作品赏析《第一季》
  • 原文地址:https://www.cnblogs.com/AntonioSu/p/15402051.html
Copyright © 2011-2022 走看看