zoukankan      html  css  js  c++  java
  • 稀疏矩阵理论与实践

    稀疏矩阵理论与实践

    1.稀疏矩阵的优化

    l  多线程。使用openmp或者mpi

    l  numanode awareness 特性。把稀疏矩阵的存储均匀地分配到两颗处理器各自的本地内存中,最大程度的利用内存带宽

    l  利用硬件cache特性,对矩阵进行分块或矩阵的循环进行限制

    l  利用pipeline,多流水线并行处理

    l  自适应分块存储结构。由于稀疏矩阵的非零元分布不一定均匀,有的分块会非常稀疏,有的则会相对稠密。对于极稀疏的分块(非零元数量远小于行数),如果用和CSR相似的压缩行存储策略,则会浪费空间,所以用COO的方式反而更能节省存储空间,提高访问效率。

    2. 矩阵(稀疏矩阵)压缩存储(3种方式)

    数据结构中,提供针对某些特殊矩阵的压缩存储结构。
    这里所说的特殊矩阵,主要分为以下两类:

    • 含有大量相同数据元素的矩阵,比如对称矩阵;
    • 含有大量 0 元素的矩阵,比如稀疏矩阵、上(下)三角矩阵;
      针对以上两类矩阵,数据结构的压缩存储思想是:矩阵中的相同数据元素(包括元素 0)只存储一个。
      对称矩阵

     

     1 对称矩阵示意图

    图 1 的矩阵中,数据元素沿主对角线对应相等,这类矩阵称为对称矩阵。

    矩阵中有两条对角线,其中图 1 中的对角线称为主对角线,另一条从左下角到右上角的对角线为副对角线。对称矩阵指的是各数据元素沿主对角线对称的矩阵。

    结合数据结构压缩存储的思想,可以使用一维数组存储对称矩阵。由于矩阵中沿对角线两侧的数据相等,因此数组中只需存储对角线一侧(包含对角线)的数据即可。
    对称矩阵的实现过程是,若存储下三角中的元素,只需将各元素所在的行标 i 和列标 j 代入下面的公式:

     

     存储上三角的元素要将各元素的行标 i 和列标 j 代入另一个公式:

     

     最终求得的 k 值即为该元素存储到数组中的位置(矩阵中元素的行标和列标都从 1 开始)。

    例如,在数组 skr[6] 中存储图 1 中的对称矩阵,则矩阵的压缩存储状态如图 3 所示(存储上三角和下三角的结果相同):

     

     图 3 对称矩阵的压缩存储示意图

    注意,以上两个公式既是用来存储矩阵中元素的,也用来从数组中提取矩阵相应位置的元素。例如,如果想从图 3 中的数组提取矩阵中位于 (3,1) 处的元素,由于该元素位于下三角,需用下三角公式获取元素在数组中的位置,即:

     

     结合图 3,数组下标为 3 的位置存储的是元素 3,与图 1 对应。

    上(下)三角矩阵

     

     图 4 上(下)三角矩阵


    如图 4 所示,主对角线下的数据元素全部相同的矩阵为上三角矩阵(图 4a)),主对角线上元素全部相同的矩阵为下三角矩阵(图 4b))。

    对于这类特殊的矩阵,压缩存储的方式是:上(下)三角矩阵采用对称矩阵的方式存储上(下)三角的数据(元素 0 不用存储)。

    例如,压缩存储图 4a) 中的上三角矩阵,矩阵最终的存储状态同图 3 相同。因此可以得出这样一个结论,上(下)三角矩阵存储元素和提取元素的过程和对称矩阵相同。

    稀疏矩阵

     

     图 5 稀疏矩阵示意图


    如图 5 所示,如果矩阵中分布有大量的元素 0,即非 0 元素非常少,这类矩阵称为稀疏矩阵。

    压缩存储稀疏矩阵的方法是:只存储矩阵中的非 0 元素,与前面的存储方法不同,稀疏矩阵非 0 元素的存储需同时存储该元素所在矩阵中的行标和列标。

    例如,存储图 5 中的稀疏矩阵,需存储以下信息:

    • (1,1,1):数据元素为 1,在矩阵中的位置为 (1,1);
    • (3,3,1):数据元素为 3,在矩阵中的位置为 (3,1);
    • (5,2,3):数据元素为 5,在矩阵中的位置为 (2,3);
    • 除此之外,还要存储矩阵的行数 3 和列数 3;
      由此,可以成功存储一个稀疏矩阵。

    注意,以上 3 种特殊矩阵的压缩存储,除了将数据元素存储起来,还要存储矩阵的行数值和列数值,具体的实现方式后续会介绍 3 种,本节仅需了解矩阵压缩存储的原理。

    3. 矩阵压缩存储的 3 种方式

    对于以上 3 种特殊的矩阵,对阵矩阵和上下三角矩阵的实现方法是相同的,且实现过程比较容易,仅需套用上面给出的公式即可。

    稀疏矩阵的压缩存储,数据结构提供有 3 种具体实现方式:

    三元组顺序表

    行逻辑链接的顺序表

    十字链表

    在Python中稀疏矩阵

    SciPy提供了使用多种数据结构创建稀疏矩阵的工具,以及将稠密矩阵转换为稀疏矩阵的工具。

    许多在NumPy阵列上运行的线性代数NumPy和SciPy函数可以透明地操作SciPy稀疏数组。此外,使用NumPy数据结构的机器学习库也可以在SciPy稀疏数组上透明地进行操作,例如用于一般机器学习的scikit-learn和用于深度学习的Keras。

    存储在NumPy数组中的稠密矩阵可以通过调用csr_matrix()函数将其转换为一个稀疏矩阵。

    在下面的例子中,我们将一个3×6的稀疏矩阵定义为一个稠密数组,将它转换为CSR稀疏表示,然后通过调用todense()函数将它转换回一个稠密数组。

    运行该示例首先打印已定义的稠密数组,接着是CSR表示,然后是重新构建的稠密矩阵。
    NumPy并没有提供一个函数来计算矩阵的稀疏性。

    不过,我们可以很容易地计算出矩阵的密度,然后从一个矩阵中减去它。NumPy数组中的非零元素可以由count_nonzero()函数给出,数组中元素的总数可以由数组的大小属性给出。因此,数组的稀疏性可以被计算为:

    下面的例子演示了如何计算数组的稀疏性。
    运行这个例子首先打印出定义的稀疏矩阵,接着是矩阵的稀疏性。
    [[1 0 0 1 0 0]
     [0 0 2 0 0 1]
     [0 0 0 2 0 0]]
     
    0.7222222222222222

     

     

    参考链接:

    https://zhuanlan.zhihu.com/p/34534763

    http://data.biancheng.net/view/183.html

    https://blog.csdn.net/yhb1047818384/article/details/78996906

     

     

     

    人工智能芯片与自动驾驶
  • 相关阅读:
    什么是动态链接库
    <<TCP/IP高效编程>>读书笔记
    C++ 函数
    我的vim配置
    FastReport4.6程序员手册_翻译
    DUnit研究初步
    ADO BUG之'无法为更新定位行....' 解决之道
    极限编程的集成测试工具Dunit
    总结
    项目管理检查清单项目启动
  • 原文地址:https://www.cnblogs.com/wujianming-110117/p/15054392.html
Copyright © 2011-2022 走看看