zoukankan      html  css  js  c++  java
  • python numpy 大矩阵运算容易内存爆炸

    在一些情况下,程序运行产生如下结果,然后进程自动终止,导致这一结果的原因很有可能是内存爆炸。

    当两个较大的 (e.g., 10000*10000 维)ndarray 做运算(加法,or 乘法)时,很容易出现这样的结果.

    linux 系统下,使用 top 命令,可以很容易地看到内存(%MEM) 的使用情况:

    解决办法

    • 大多数情况下,这种大矩阵都是稀疏的。尽可能地利用稀疏计算的方式,例如稀疏矩阵,或者只计算非 0 位置的值。
    • 如果都是整数运算,可以设置 dtype=int,而非 dtype=float, 可以省下不少空间。

    例如:如下代码段2 可以完成代码段1 的功能,且避免了大量内存的开销,同时加快了运行速度。

    # 代码段 1,true_similarity_matrix 是 int, similarity_matrix 是 float
    tmp_matrix = similarity_matrix * true_similarity_matrix   # 内存会炸掉,两个 10000*10000 维 float array
    num_correct_edge = sum(sum(tmp_matrix))
    
    # 代码段 2
    for i in range():
        for j in range():
            set_true_ij.append(i,j)
    num_correct_edge = 0
    for i, j in set_true_ij:
        num_correct_edge += similarity_matrix[i,j]
    
  • 相关阅读:
    Python2 和 Python3的区别 更新中
    CentOS下图形界面安装_Orcaale 11g
    Nmap_使用介绍
    shell_innobackup增量备份步骤
    shell_跳板机推送公钥
    shell_clean_log
    shell_xtrabackup_backup_mysql
    gitlab免密登录
    gitlab安装与部署
    git合并分支
  • 原文地址:https://www.cnblogs.com/Gelthin2017/p/13943810.html
Copyright © 2011-2022 走看看