zoukankan      html  css  js  c++  java
  • 20、numpy——IO

    NumPy IO

    Numpy 可以读写磁盘上的文本数据或二进制数据。

    NumPy 为 ndarray 对象引入了一个简单的文件格式:npy。

    npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。

    常用的 IO 函数有:

    • load() 和 save() 函数是读写文件数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。
    • savze() 函数用于将多个数组写入文件,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npz 的文件中。
    • loadtxt() 和 savetxt() 函数处理正常的文本文件(.txt 等)

    1、numpy.save()

    numpy.save() 函数将数组保存到以 .npy 为扩展名的文件中。

    numpy.save(file, arr, allow_pickle=True, fix_imports=True)

    参数说明:

    • file:要保存的文件,扩展名为 .npy,如果文件路径末尾没有扩展名 .npy,该扩展名会被自动加上。
    • arr: 要保存的数组
    • allow_pickle: 可选,布尔值,允许使用 Python pickles 保存对象数组,Python 中的 pickle 用于在保存到磁盘文件或从磁盘文件读取之前,对对象进行序列化和反序列化。
    • fix_imports: 可选,为了方便 Pyhton2 中读取 Python3 保存的数据。
    import numpy as np
    a = np.array([1, 2, 3, 4, 5])
    # 保存到 outfile.npy 文件上
    np.save('outfile.npy', a)
    # 保存到 outfile2.npy 文件上,如果文件路径末尾没有扩展名 .npy,该扩展名会被自动加上
    np.save('outfile2', a)

    我们可以查看文件内容:

    揘UMPY v {'descr': '<i4', 'fortran_order': False, 'shape': (5,), }     

    可以看出文件是乱码的,因为它们是 Numpy 专用的二进制格式后的数据。

    我们可以使用 load() 函数来读取数据就可以正常显示了:

    1 import numpy as np
    2 b = np.load('outfile.npy')
    3 print(b)

    执行结果:

    [1 2 3 4 5]

    2、np.savez

    numpy.savez() 函数将多个数组保存到以 npz 为扩展名的文件中。

    1 numpy.savez(file, *args, **kwds)

    参数说明:

    • file:要保存的文件,扩展名为 .npz,如果文件路径末尾没有扩展名 .npz,该扩展名会被自动加上。
    • args: 要保存的数组,可以使用关键字参数为数组起一个名字,非关键字参数传递的数组会自动起名为 arr_0arr_1, … 。
    • kwds: 要保存的数组使用关键字名称。
     1 import numpy as np
     2 a = np.array([[1, 2, 3], [4, 5, 6]])
     3 b = np.arange(0, 1.0, 0.1)
     4 c = np.sin(b)
     5 # c 使用了关键字参数 sin_array
     6 np.savez("runoob.npz", a, b, sin_array=c)
     7 r = np.load("runoob.npz")
     8 print(r.files)  # 查看各个数组名称
     9 print(r["arr_0"])  # 数组 a
    10 print(r["arr_1"])  # 数组 b
    11 print(r["sin_array"])  # 数组 c

    执行结果:

    ['sin_array', 'arr_0', 'arr_1']
    [[1 2 3]
     [4 5 6]]
    [0.  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
    [0.         0.09983342 0.19866933 0.29552021 0.38941834 0.47942554
     0.56464247 0.64421769 0.71735609 0.78332691]

    3、savetxt()

    savetxt() 函数是以简单的文本文件格式存储数据,对应的使用 loadtxt() 函数来获取数据。

    np.loadtxt(FILENAME, dtype=int, delimiter=' ')
    np.savetxt(FILENAME, a, fmt="%d", delimiter=",")

    参数 delimiter 可以指定各种分隔符、针对特定列的转换器函数、需要跳过的行数等。

    1 import numpy as np
    2 a = np.array([1, 2, 3, 4, 5])
    3 np.savetxt('out.txt', a)
    4 b = np.loadtxt('out.txt')
    5 print(b)

    执行结果:

    [1. 2. 3. 4. 5.]

    使用 delimiter 参数:

    1 import numpy as np
    2 a = np.arange(0, 10, 0.5).reshape(4, -1)
    3 print(a)
    4 np.savetxt("out.txt", a, fmt="%d", delimiter=",")  # 改为保存为整数,以逗号分隔
    5 b = np.loadtxt("out.txt", delimiter=",")  # load 时也要指定为逗号分隔
    6 print(b)

    执行结果:

    [[0.  0.5 1.  1.5 2. ]
     [2.5 3.  3.5 4.  4.5]
     [5.  5.5 6.  6.5 7. ]
     [7.5 8.  8.5 9.  9.5]]
    [[0. 0. 1. 1. 2.]
     [2. 3. 3. 4. 4.]
     [5. 5. 6. 6. 7.]
     [7. 8. 8. 9. 9.]]
  • 相关阅读:
    石子归并
    【性能测试工具】- ApacheBench
    如何提问
    HTTP 0.9 / 1.0 / 1.1
    【NO.3-1】Jmeter
    【有意思的BUG】未名
    【FlashPlayer】-Debug版本-开发人员推荐
    【NO.1】Jmeter-安装JDK- 配置Jmeter运行的环境
    【IP限制】验证是否限制了境外IP访问权限
    【有意思的BUG】视频连接超时
  • 原文地址:https://www.cnblogs.com/weststar/p/11596703.html
Copyright © 2011-2022 走看看