zoukankan      html  css  js  c++  java
  • 科学计算基础包——Numpy

    一、NumPy简介

      NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。

    1、NumPy的主要功能

      (1)ndarray:一个多维数组结构,高效且节省空间。
      (2)无需循环对整组数据进行快速运算的数学函数。
      (3)线性代数、随机数生成和傅里叶变换功能。

    2、安装和引用

    pip install numpy   # 安装方法
    
    import numpy as np    # 引用方法
    

    3、为什么要使用NumPy?

    (1)例:已知若干家跨国公司的市值(美元),将其换算为人民币

    import numpy as np
    import random
    
    # uniform随机生成浮点数,这里是随机生成100~200之间的浮点数
    a = [random.uniform(100.0, 200.0) for i in range(50)]
    print(a)
    x = 6.8   # 人民币和美元的汇率
    
    # 方法一:使用循环
    b = []
    for ele in a:
        b.append(ele * x)
    print(b)
    
    # 方法二:使用numpy
    a = np.array(a)
    c = a * x
    print(c)
    

    (2)例:已知购物车中每件商品的价格和商品件数,求总金额

    import numpy as np
    import random
    
    # uniform随机生成浮点数,这里是随机生成100~200之间的浮点数
    a = [random.uniform(100.0, 200.0) for i in range(50)]
    g = [random.randint(1, 10) for j in range(50)]
    d = np.array(g)
    
    sum = a*d.sum()    # 所有商品总金额
    print(sum)
    

    二、ndarray-多维数组对象

      创建ndarray:np.array(array_like)

      数组和列表的区别:

    1. 数组对象内的元素类型必须相同
    2. 数组大小不可修改

    1、ndarray常用属性

    属性 属性含义
    T 数组的转置(对高维数组而言)
    size 数组元素的个数
    ndim 数组的维数
    shape 数组的维度大小(元组形式)
    dtype 数组元素的数据类型

    (1)dtype

      可以查看具体数据类型。

    >>> import numpy as np
    >>> a = np.array(range(10))
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> a.dtype
    dtype('int64')
    

    (2)size

      查看当前存了多少个元素。

    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> a.size
    10
    

    (3)ndim

      查看数组的维数。

    >>> a
    array([[1, 2, 3],
           [4, 5, 6]])
    >>> a.ndim
    2
    

    (3)shape

      返回一个元组,说明当前数组对象是一个几行几列的多维数组。

    >>> a = np.array([[1,2,3], [4,5,6]])
    >>> a
    array([[1, 2, 3],
           [4, 5, 6]])
    >>> a.dtype
    dtype('int64')
    >>> a.size
    6
    >>> a.shape
    (2, 3)    # 返回一个元组,说明是一个两行三列的二维数组
    
    # 三维数组
    >>> a = np.array([[[1,2,3], [4,5,6]],[[1,2,3], [3,4,5]]])
    >>> a
    array([[[1, 2, 3],
            [4, 5, 6]],
           [[1, 2, 3],
            [3, 4, 5]]])
    >>> a.shape    # 两页两行三列的三维数组
    (2, 2, 3)
    

      还可以使用reshape函数来调整数组大小

    >>> a=np.arange(15)
    >>> a
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])
    >>> a.reshape((3,5))
    array([[ 0,  1,  2,  3,  4],
           [ 5,  6,  7,  8,  9],
           [10, 11, 12, 13, 14]])
    

      查看获取对应位置元素

    >>> a
    array([[ 0,  1,  2,  3,  4],
           [ 5,  6,  7,  8,  9],
           [10, 11, 12, 13, 14]])
    >>> a[0][0]
    0
    >>> a[0,0]
    0
    

    (4)T

      数组转置。

    >>> a = np.array([[1,2,3], [4,5,6]])
    >>> a
    array([[1, 2, 3],
           [4, 5, 6]])
    >>> a.T
    array([[1, 4],
           [2, 5],
           [3, 6]])
    >>> a = a.T
    >>> a.T
    array([[1, 2, 3],
           [4, 5, 6]])
    >>> _.T
    array([[1, 4],
           [2, 5],
           [3, 6]])
    

    2、ndarray数据类型

      ndarray中绝大多数情况下都是保存各种数字,基本不保存字符串数据。

    类型 字节细分
    布尔型 bool_
    整型 int_ int8 int16 int32 int64
    无符号整型 uint8 uint16 uint32 uint64
    浮点型 float_ float16 float32 float64
    复数型 complex_ complex64 complex128

    注意:
      (1)64位的整数最大值是:263-1=9223372036854775807;
      (2)无符号整型只表示正数,因此64位的无符号整数最大值是:2
    64-1=18446744073709551615

    3、ndarray对象创建

    方法 描述
    array() 将列表转换为数组,可选择显示指定dtype
    arange() range的numpy版,支持浮点数
    linespace() 类似arange(),第三个参数为数组长度
    zeros() 根据指定形状和dtype创建全0数组
    ones() 根据指定形状和dtype创建全1数组
    empty() 根据指定形状和dtype创建空数组(随机值)
    eye() 根据指定边长创建单位矩阵

    (1)zeros、ones

      zeros:生成值全为0的数组。
      ones:生成值全为1的数组。

    # 列表的方法
    >>> np.array([0]*10)
    array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
    
    # zeros()方法
    >>> np.zeros(10)
    array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
    >>> a = np.zeros(10)
    >>> a.dtype
    dtype('float64')    # 默认计算是浮点数
    
    # 设置类型参数
    >>> a = np.zeros(10, dtype='int')
    >>> a
    array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
    
    # ones()方法生成全是全为1的数组
    >>> a = np.ones(10)
    >>> a
    array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
    

    (2)empty

      根据指定形状和dtype创建空数组(随机数)。取到内存内留存的值。
      可以先创建数组,再将这些值都覆盖掉。

    >>> a = np.empty(100)
    >>> a
    array([ 2.00000000e+000,  2.00000000e+000,  2.86558075e-322,
            ...
            7.10580593e+159])
    

      

    (3)arange

      range的numpy版,支持浮点数。

    >>> np.arange(10)
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    
    # 设置起始值和结束值
    >>> np.arange(3,9)
    array([3, 4, 5, 6, 7, 8])
    
    # 设置起始值、结束值和步长(python的range没有步长设置)
    >>> np.arange(2,7,0.5)   # 注意:步长可以为小数
    array([2. , 2.5, 3. , 3.5, 4. , 4.5, 5. , 5.5, 6. , 6.5])
    

    (4)linespace

      数学中的概念:线性空间。它与arange使用非常相似。但第三个参数不是步长还是把数组分为多少份。

    >>> np.linspace(0,10,11)
    array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])
    >>> _.size
    11
    
    >>> np.linspace(0,9,20)
    array([0.        , 0.47368421, 0.94736842, 1.42105263, 1.89473684,
           2.36842105, 2.84210526, 3.31578947, 3.78947368, 4.26315789,
           4.73684211, 5.21052632, 5.68421053, 6.15789474, 6.63157895,
           7.10526316, 7.57894737, 8.05263158, 8.52631579, 9.        ])
           
    # 数学中应用
    import numpy as np
    import matplotlib.pyplot as plt   # python的绘图库
    
    x = np.linspace(-10,10,10000)
    y = x**2
    plt.plot(x,y)   # 使用matplotlib来绘制点
    plt.show()
    

      应用执行效果如下:

    数学应用

    (5)eye

      生成线性代数中的单位矩阵。对角线为1,其他位置是0。

    >>> np.eye(5)
    array([[1., 0., 0., 0., 0.],
           [0., 1., 0., 0., 0.],
           [0., 0., 1., 0., 0.],
           [0., 0., 0., 1., 0.],
           [0., 0., 0., 0., 1.]])
    

    三、ndarray-批量运算

    1、数组和标量之间的运算

    a+1 a*3 1//a a**0.5 a>5

    >>> a = np.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> a+1
    array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])
    >>> a*3
    array([ 0,  3,  6,  9, 12, 15, 18, 21, 24, 27])
    >>> 3/a
    array([       inf, 3.        , 1.5       , 1.        , 0.75      ,
           0.6       , 0.5       , 0.42857143, 0.375     , 0.33333333])
    <string>:1: RuntimeWarning: divide by zero encountered in true_divide
    

    2、同样大小数组之间的运算

    a+b a/b a**b a%b a==b a>b

    >>> b = np.arange(10,20)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> b
    array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])
    >>> a+b
    array([10, 12, 14, 16, 18, 20, 22, 24, 26, 28])
    
    >>> a>b
    array([False, False, False, False, False, False, False, False, False,
           False])
    >>> a[0]=20
    >>> a>b
    array([ True, False, False, False, False, False, False, False, False,
           False])
    

    四、numPy索引和切片

      ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。
      ndarray 数组可以基于 0 - n 的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。

    1、ndarray-索引

    # 一维数组的索引
    >>> a=np.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> a[5]
    5
    
    # 多维数组的索引
    >>> a = a.reshape((2,5))
    >>> a
    array([[0, 1, 2, 3, 4],
           [5, 6, 7, 8, 9]])
    # (1)列表式写法
    >>> a[1][3]
    8
    # (2)新式写法
    >>> a[1,3]
    8
    

    2、ndarray-切片

    # 一维数组的切片
    >>> a = np.arange(15)
    >>> a
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])
    >>> a[0:4]
    array([0, 1, 2, 3])
    >>> a[:4]
    array([0, 1, 2, 3])
    >>> a[4:]
    array([ 4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])
    
    # 多维数组的切片
    >>> a = np.arange(15).reshape((3,5))
    >>> a
    array([[ 0,  1,  2,  3,  4],
           [ 5,  6,  7,  8,  9],
           [10, 11, 12, 13, 14]])
    >>> a[0:2,0:2]   # 切前两行前两列
    array([[0, 1],
           [5, 6]])
    >>> a[1:, 2:4]   # 从第二行开始切,切第3-4列
    array([[ 7,  8],
           [12, 13]])
    

      数组切片和列表切片的不同:数组切片时并不会自动复制(而是创建一个视图),在切片数组上的修改会影响原数组。

    >>> a = np.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> b = list(range(10))
    >>> b
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> c = a[0:4]
    >>> c
    array([0, 1, 2, 3])
    >>> d = b[0:4]
    >>> d
    [0, 1, 2, 3]
    >>> c[0] = 20
    >>> d[0] = 20
    >>> c
    array([20,  1,  2,  3])
    >>> d
    [20, 1, 2, 3]
    >>> a   # 可以看到对切片数组修改影响了原数组
    array([20,  1,  2,  3,  4,  5,  6,  7,  8,  9])
    >>> b
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    

      copy()方法可以创建数组的深拷贝。

    >>> a[0] = 0
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> c = a[0:4].copy()
    >>> c
    array([0, 1, 2, 3])
    >>> c[0] = 20
    >>> c
    array([20,  1,  2,  3])
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    

    五、高级索引

    1、ndarray-布尔型索引

      布尔型索引:将同样大小的布尔数组传进索引,会返回一个由所有True对应位置的元素的数组。

    (1)问题:给一个数组,选出数组中所有大于5的数

    # 常规方法
    >>> import random
    >>> a = [random.randint(0, 10) for i in range(20)]
    >>> a
    [8, 2, 4, 0, 9, 0, 1, 7, 10, 9, 4, 0, 5, 8, 5, 8, 4, 0, 3, 8]
    >>> filter(lambda x:x>5, a)
    <filter object at 0x11704b320>
    >>> list(filter(lambda x:x>5, a))
    [8, 9, 7, 10, 9, 8, 8, 8]
    
    # 布尔索引解决
    >>> a = np.array(a)   # 列表转化为数组
    >>> a
    array([ 8,  2,  4,  0,  9,  0,  1,  7, 10,  9,  4,  0,  5,  8,  5,  8,  4,
            0,  3,  8])
    >>> a[a>5]
    array([ 8,  9,  7, 10,  9,  8,  8,  8]) 
    

      原理:数组和标量的运算,a > 5 会对a中的每一个元素进行判断,返回一个布尔数组。
         布尔型索引,将同样大小的布尔数组传进索引,会返回一个由所有True对应位置的元素的数组。

    (2)问题:给一个数组,选出数组中所有大于5的偶数。

    >>> a
    array([ 8,  2,  4,  0,  9,  0,  1,  7, 10,  9,  4,  0,  5,  8,  5,  8,  4,
            0,  3,  8])
    >>> b = a[a>5]
    >>> b
    array([ 8,  9,  7, 10,  9,  8,  8,  8])
    >>> b[b%2==0]
    array([ 8, 10,  8,  8,  8])
    
    # 合并写法
    >>> a
    array([ 8,  2,  4,  0,  9,  0,  1,  7, 10,  9,  4,  0,  5,  8,  5,  8,  4,
            0,  3,  8])
    >>> a[(a>5) & (a%2==0)]    # 与运算  注意:& 和 and的区别
    array([ 8, 10,  8,  8,  8])
    

    (3)问题:给一个数组,选出数组中所有大于5的数和偶数。(or)

    # 或运算,or关系
    a[(a>5) | (a%2==0)]
    array([ 8,  2,  4,  0,  9,  0,  7, 10,  9,  4,  0,  8,  8,  4,  0,  8])
    

    2、ndarray-花式索引

      花式索引指的是利用整数数组进行索引。
      花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素;如果目标是二维数组,那么就是对应下标的行。
      花式索引跟切片不一样,它总是将数据复制到新数组中。

    (1)问题:对于一个数组,选出其第1,3,4,6,7个元素,组成新的二维数组。

    >>> a = np.arange(20)
    >>> a
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
           17, 18, 19])
    >>> a[[1,3,4,6,7]]   # 整数数组索引
    array([1, 3, 4, 6, 7])
    

    (2)问题:对一个二维数组,选出其第一列和第三列,组成新的二维数组。

    >>> a = np.arange(20).reshape(4,5)
    >>> a
    array([[ 0,  1,  2,  3,  4],
           [ 5,  6,  7,  8,  9],
           [10, 11, 12, 13, 14],
           [15, 16, 17, 18, 19]])
    >>> a[0, 2:4]
    array([2, 3])
    >>> a[0]>2
    array([False, False, False,  True,  True])
    >>> a[0, a[0]>2]
    array([3, 4])
    # 注意花式索引不能同时出现在逗号两边,比如想选择6、8、16、18
    >>> a[[1,3], [1,3]]
    array([ 6, 18])    # 实际取的是a[1,1] 和a[3,3]的值
    
    # 实际解法如下所示:
    >>> a[[1,3],:]   # 第1行到第4行,列全切
    array([[ 5,  6,  7,  8,  9],
           [15, 16, 17, 18, 19]])
    >>> a[:,[1,3]]   # 行全切,切第一列到第三列
    array([[ 1,  3],
           [ 6,  8],
           [11, 13],
           [16, 18]])
    >>> a[[1,3],:][:,[1,3]]
    array([[ 6,  8],
           [16, 18]])
    

    六、NumPy-array通用函数

      通用函数:能同时对数组中所有元素进行运算的函数。常见通用函数如下所示:

    1、一元函数

      abs,sqrt,exp,log,ceil,floor,rint,trunc,modf,isnan,isinf,cos,sin,tan

    >>> a = np.arange(-5,5)
    >>> a
    array([-5, -4, -3, -2, -1,  0,  1,  2,  3,  4])
    
    >>> np.abs(a)    # 取绝对值
    array([5, 4, 3, 2, 1, 0, 1, 2, 3, 4])
    >>> abs(a)
    array([5, 4, 3, 2, 1, 0, 1, 2, 3, 4])
    
    >>> np.sqrt(a)   # 开方
    <string>:1: RuntimeWarning: invalid value encountered in sqrt
    array([       nan,        nan,        nan,        nan,        nan,
           0.        , 1.        , 1.41421356, 1.73205081, 2.        ])
    
    # 向下取整:单个是math.floor();批量是:np.floor()
    >>> import math
    >>> math.floor(-1.6)
    -2
    >>> math.floor(1.6)
    1
    # 向上取整:单个是math.ceil(),批量是np.ceil()
    >>> math.ceil(1.6)
    2
    >>> math.ceil(-1.6)
    -1
    # 四舍五入:round()
    >>> round(1.6)
    2
    >>> round(-1.6)
    -2
    >>> round(-1.3)
    -1
    
    # 批量操作
    >>> a = np.arange(-5.5, 5.5)
    >>> a
    array([-5.5, -4.5, -3.5, -2.5, -1.5, -0.5,  0.5,  1.5,  2.5,  3.5,  4.5])
    >>> np.floor(a)   # 向下取整
    array([-6., -5., -4., -3., -2., -1.,  0.,  1.,  2.,  3.,  4.])
    >>> np.ceil(a)    # 向上取整
    array([-5., -4., -3., -2., -1., -0.,  1.,  2.,  3.,  4.,  5.])
    >>> np.round(a)   # 四舍五入
    array([-6., -4., -4., -2., -2., -0.,  0.,  2.,  2.,  4.,  4.])
    >>> np.rint(a)    # 四舍五入(同round())
    array([-6., -4., -4., -2., -2., -0.,  0.,  2.,  2.,  4.,  4.])
    >>> np.trunc(a)   # 截断(丢弃小数部分)
    array([-5., -4., -3., -2., -1., -0.,  0.,  1.,  2.,  3.,  4.])
    
    # modf:整数和小数部分分拆
    >>> a
    array([-5.5, -4.5, -3.5, -2.5, -1.5, -0.5,  0.5,  1.5,  2.5,  3.5,  4.5])
    >>> np.modf(a)
    (array([-0.5, -0.5, -0.5, -0.5, -0.5, -0.5,  0.5,  0.5,  0.5,  0.5,  0.5]), array([-5., -4., -3., -2., -1., -0.,  0.,  1.,  2.,  3.,  4.]))
    >>> k,y = np.modf(a)
    >>> k
    array([-0.5, -0.5, -0.5, -0.5, -0.5, -0.5,  0.5,  0.5,  0.5,  0.5,  0.5])
    >>> y
    array([-5., -4., -3., -2., -1., -0.,  0.,  1.,  2.,  3.,  4.])
    

    2、二元函数

      add,substract,multiply,divide,power,mod,maximum,mininum

    # maximum:对两个数组每个值均取最大值
    >>> a
    array([3, 4, 5, 6, 7])
    >>> b
    array([3, 0, 5, 0, 7])
    >>> np.maximum(a,b)
    array([3, 4, 5, 6, 7])
    
    # minimum:对两个数组每个值均取最小值
    >>> np.minimum(a,b)
    array([3, 0, 5, 0, 7])
    

    3、补充:浮点数特殊值

      Numpy中创建特殊值:np.nan np.inf
      在数据分析中,nan常被用作表示数据缺失值

    # python中有两个浮点数特殊值
    >>> float('3.5')
    3.5
    >>> float('nan')
    nan
    >>> float('inf')
    inf
    
    # nan(Not a Number):不等于任何浮点数(nan != nan)
    >>> a = np.arange(5)
    >>> a
    array([0, 1, 2, 3, 4])
    >>> a/a
    <string>:1: RuntimeWarning: invalid value encountered in true_divide
    array([nan,  1.,  1.,  1.,  1.])
    >>> np.nan   # 获取nan值
    nan
    >>> np.nan == np.nan   # 两个nan不相等,因为nan不等于任何值
    False
    
    >>> b = a/a
    >>> b
    array([nan,  1.,  1.,  1.,  1.])
    >>> np.isnan(b)    # 判断出数组中哪些是nan值
    array([ True, False, False, False, False])
    >>> b[~(np.isnan(b))]   # ~取反
    array([1., 1., 1., 1.])
    
    
    # inf(infinity):比任何浮点数都大,表示无穷大的数
    >>> float('inf') > 10000000
    True
    >>> a = np.array([3,4,5,6,7])
    >>> b = np.array([3,0,5,0,7])
    >>> a/b
    array([ 1., inf,  1., inf,  1.])
    >>> np.inf == np.inf   # 无穷大的数可以相等
    True
    
    # 过滤掉数组中inf的数
    >>> c = a/b
    >>> c
    array([ 1., inf,  1., inf,  1.])
    >>> c[c!=np.inf]
    array([1., 1., 1.])
    # 利用isinf()的写法
    >>> c[~np.isinf(c)]
    array([1., 1., 1.])
    

    七、NumPy-数学和统计方法

    >>> a
    array([3, 4, 5, 6, 7])
    
    # sum:求和
    >>> a.sum()
    25
    
    # mean:求平均数
    >>> a.mean()
    5.0
    
    # var:求方差,方差表示整组数据的离散程度
    >>> a.var()
    2.0
    # 方差公式验证:
    >>> a
    array([3, 4, 5, 6, 7])
    >>> ((3-5)**2 + (4-5)**2 + (5-5)**2 + (6-5)**2 + (7-5)**2)/5
    2.0
    
    # std:求标准差(对方差开根)
    >>> a.std()
    1.4142135623730951
    >>> math.sqrt(2)
    1.4142135623730951
    # 标准差和均值可以估计整个数组的范围
    >>> a = np.arange(0,10,0.2)
    >>> a
    array([0. , 0.2, 0.4, 0.6, 0.8, 1. , 1.2, 1.4, 1.6, 1.8, 2. , 2.2, 2.4,
           2.6, 2.8, 3. , 3.2, 3.4, 3.6, 3.8, 4. , 4.2, 4.4, 4.6, 4.8, 5. ,
           5.2, 5.4, 5.6, 5.8, 6. , 6.2, 6.4, 6.6, 6.8, 7. , 7.2, 7.4, 7.6,
           7.8, 8. , 8.2, 8.4, 8.6, 8.8, 9. , 9.2, 9.4, 9.6, 9.8])
    >>> a.mean()
    4.9
    >>> a.std()  # 标准差
    2.8861739379323628
    >>> a.mean()-a.std()   # 大概估计数组的范围
    2.0138260620676376
    >>> a.mean()-2*a.std()
    -0.8723478758647252
    >>> a.mean()+2*a.std()
    10.672347875864727
    
    # min:求最小值
    >>> a.min()
    0.0
    
    # max:求最大值
    >>> a.max()
    9.8
    
    # argmin:求最小值索引
    >>> a.argmin()
    0
    
    # argmax:求最大值索引
    >>> a.argmax()
    49
    

    八、NumPy-随机数生成

    # python默认的random模块
    >>> random.random()
    0.5107400270751336
    >>> random.randint(0,10)
    9
    >>> random.choice([1,3,4,5])
    5
    # shuffle():用于将列表中元素打乱
    >>> a = [1,3,4,5,7]
    >>> random.shuffle(a)   # 打乱列表
    >>> a
    [1, 4, 7, 3, 5]
    # uniform(a,b):用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n:a<=n<=b
    >>> random.uniform(2.0,4.0)
    2.190653911434251
    
    # 随机函数在np.random子包内方法
    # rand:给定形状产生随机数组(0到1之间的数)
    >>> np.random.rand(10)
    array([0.28624648, 0.69121364, 0.74607992, 0.2587513 , 0.60445688,
           0.2890542 , 0.88712216, 0.93544304, 0.99640741, 0.73059636])
    
    # randint:给定形状产生随机整数
    >>> np.random.randint(0,10)     # 取范围内随机数
    3
    >>> np.random.randint(0,10,10)  # 用随机数生成一个有10个元素的数组
    array([7, 5, 6, 8, 5, 4, 1, 9, 7, 4])
    >>> np.random.randint(0,10,(3,5))    # 用随机数生成一个三行五列的二维数组
    array([[2, 1, 5, 0, 9],
           [5, 4, 8, 7, 3],
           [2, 0, 5, 9, 9]])
    >>> np.random.randint(0,10,(3,5,5))  # 用随机数生成一个三维数组
    array([[[7, 4, 8, 5, 9],
            [8, 1, 4, 3, 5],
            [9, 8, 9, 3, 1],
            [8, 8, 7, 0, 7],
            [7, 0, 8, 6, 8]],
           [[3, 1, 8, 1, 2],
            [8, 2, 7, 6, 4],
            [4, 3, 8, 0, 6],
            [3, 5, 3, 1, 2],
            [4, 2, 6, 6, 2]],
           [[4, 5, 5, 4, 6],
            [0, 7, 5, 6, 6],
            [6, 4, 8, 8, 2],
            [5, 0, 3, 7, 9],
            [8, 5, 6, 2, 5]]])
    
    # choice:给定形状产生随机选择
    >>> np.random.choice([1,2,3,4,5])
    2
    >>> np.random.choice([1,2,3,4,5],10)
    array([1, 2, 1, 4, 1, 3, 2, 5, 3, 2])
    
    # shuffle:与random.shuffle相同
    
    
    # uniform:给定形状产生随机数组
    >>> np.random.uniform(2.0,5.0)
    2.9530512208056257
    >>> np.random.uniform(2.0,5.0,10)
    array([3.9142783 , 4.71991751, 4.05954663, 4.13170221, 3.88043716,
           2.00233882, 2.34833856, 2.48430517, 3.07240671, 3.4608536 ])
    
  • 相关阅读:
    spark学习进度9
    spark学习进度8-scrapy框架的安装与使用
    spark学习进度7-Python爬取大学排名实例
    spark学习进度6-Python爬取数据的四个简单实例
    spark学习进度5-利用开发工具IntelliJ IDEA编写Spark应用程序(Scala+Maven)
    Scala官网下载不下来问题-已解决
    spark学习进度4
    大数据学习总结07
    大数据学习总结06
    大数据学习总结05
  • 原文地址:https://www.cnblogs.com/xiugeng/p/10327656.html
Copyright © 2011-2022 走看看