通用函数
- 一元ufunc
- abs、fabs:计算整数、浮点数或复数的绝对值。对于非复数值,可以使用更快的fabs
- sqrt:计算各元素的平方根。相当于arr**0.5
- square:计算各元素的平方。相当于arr**2
- exp:计算各元素的指数
- log、log10、log2、log1p:分别对自然对数(底数为e)、底数为10,2的log,log(1+x)
- sign:计算各元素的正负号,1(正数)、0(零)、-1(复数)
- ceil:计算各元素的ceiling值,即向上取整
- floor:计算各元素的floor值,即向下取整
- rint:将各元素四舍五入到最接近的整数
- modf:将数组的小数和整数部分以两个独立数组返回
- isnan:返回一个表示“哪个值是NaN”的布尔型数组
- isfinte、isinf:分别返回一个表示“哪个元素是有穷的(非inf,非NaN)”或“哪些元素是无穷的”的布尔型数组
- cos、cosh、sin、sinh、tan、tanh:普通型和双曲型三角函数
- arccos、arccosh、arcsin、arcsinh、arctan、arctanh:反三角函数
- logical_not:计算个元素not x 的真值。相当于-arr
- 二元ufunc
- add:将数组中对应的元素想加
- subtract:从第一个数组中减去第二个数组中的元素
- multiply:数组元素相乘
- divide、floor_divide:除法或下圆整除法(丢弃余数)
- power:对于第一个数组中的元素A,根据第二个数组中的元素B,计算A的B次方
- maximum、fmax:元素级最大值计算。fmax忽略NaN
- minimum、fmin:元素级最小值计算。fmin忽略NaN
- mod:元素级求模计算(除法的余数)
- copysign:将第二个数组中的值的符号复制给第一个数组中的值
- greater、greater_equal、less、less_equal、equal、not_equal:元素级比较运算,最终产生布尔型数组。相当于>、>=、<、<=、==、!=
- logical_and、logical_or、logical_xor:元素级的真值逻辑运算。相当于运算符&、|、^
import numpy as np # abs、fabs:计算整数、浮点数或复数的绝对值。对于非复数值,可以使用更快的fabs arr_abs = np.array([1,2,-3,4,-5.98]) print(np.abs(arr_abs)) # [1. 2. 3. 4. 5.98] print(np.fabs(arr_abs)) # [1. 2. 3. 4. 5.98] # sqrt:计算各元素的平方根。相当于arr**0.5 arr_sqrt = np.array([1,4,9,16,25]) print(np.sqrt(arr_sqrt)) # [1. 2. 3. 4. 5.] # square:计算各元素的平方。相当于arr**2 arr_square = np.array([1,2,3,4,5]) print(np.square(arr_square)) # [ 1 4 9 16 25] # sign:计算各元素的正负号,1(正数)、0(零)、-1(复数) arr_sign = np.array([-2,-1,0,1,2]) print(np.sign(arr_sign)) # [-1 -1 0 1 1] # ceil:计算各元素的ceiling值,即向上取整 arr_ceil = np.array([1.2,2.5,3.6,4.1,5.9]) print(np.ceil(arr_ceil)) # [2. 3. 4. 5. 6.] # floor:计算各元素的floor值,即向下取整 arr_floor = np.array([1.2,2.5,3.6,4.1,5.9]) print(np.floor(arr_floor)) # [1. 2. 3. 4. 5.] # rint:将各元素四舍五入到最接近的整数 arr_rint = np.array([1.2,2.5,2.51,3.6,4.1,5.9]) print(np.rint(arr_rint)) # [1. 2. 3. 4. 4. 6.] # modf:将数组的小数和整数部分以两个独立数组返回 arr_modf = np.array([1.2,2.5,2.51]) print(np.modf(arr_modf)) # (array([0.2 , 0.5 , 0.51]), array([1., 2., 2.])) # isnan:返回一个表示“哪个值是NaN”的布尔型数组 arr_isnan = np.array([1,2,3,4,5]) print(np.isnan(arr_isnan)) # [False False False False False]
利用数组进行数据处理
import numpy as np import matplotlib.pyplot as plt # 用数组表达式代替循环的做法,通常被称为矢量化 points = np.arange(-5,5,0.01) # 1000个间隔相等的点 xs,ys = np.meshgrid(points,points) z = np.sqrt(xs**2+ys**2) plt.imshow(z) plt.colorbar() plt.title("Image plot of $sqrt{x^2+y^2}$ for a grid of values") plt.show()
将条件逻辑表述为数组运算
import numpy as np # numpy.where函数是 x if condition else y的矢量化版本。 from numpy.matlib import randn xarr = np.array([1.1,1.2,1.3,1.4,1.5]) yarr = np.array([2.1,2.2,2.3,2.4,2.5]) cond = np.array([True,False,True,True,False]) # 当cond为True时,选择xarr,否则选择yarr result = [] for x,y,c in zip(xarr,yarr,cond): if c: result.append(x) else: result.append(y) print(result) # [1.1, 2.2, 1.3, 1.4, 2.5] result = [(x if c else y) for x,y,c in zip(xarr,yarr,cond)] print(result) # [1.1, 2.2, 1.3, 1.4, 2.5] # 换成np.where写法 result = np.where(cond,xarr,yarr) print(result) # [1.1 2.2 1.3 1.4 2.5] # 生成一个随机数组 arr = randn(4,4) print(arr) ''' [[-1.16508783 0.18874028 1.0206809 0.76529663] [ 1.54512481 -1.36804933 -1.80001501 -0.88638478] [-2.1297874 0.28795926 -1.30068181 1.8016327 ] [-1.34510486 0.60960465 -0.42626585 -0.6275682 ]] ''' # 将正值替换为2,负值替换为-2 print(np.where(arr>0,2,-2)) ''' [[-2 2 2 2] [ 2 -2 -2 -2] [-2 2 -2 2] [-2 2 -2 -2]] ''' # 将正值替换为2,负值不变 print(np.where(arr>0,2,arr)) ''' [[-1.16508783 2. 2. 2. ] [ 2. -1.36804933 -1.80001501 -0.88638478] [-2.1297874 2. -1.30068181 2. ] [-1.34510486 2. -0.42626585 -0.6275682 ]] ''' # 接下来有点费脑子 ''' result = [] for i in range[n]: if cond1[i] and cond2[]: result.append(0) elif cond1[i]: result.append(1) elif cond2[2]: result.append(2) else: result.append(3) # 可以改写成一个嵌套where np.where(cond1 & cond2,0, np.where(cond1,1, np.where(cond2,2,3))) '''
数学和统计方法
- 基本数组统计方法
- sum:对数组中全部或某轴向的元素求和。零长度的数组sum为0
- mean:算术平均数。零长度的数组mean为NaN
- std、var:标准差和方差,自由度可调(默认为n)
- min、max:最大值和最小值
- argmin、argmax:最小和最大元素的索引
- cumsum:所有元素的累计和
- cumpord:所有元素的累计积
import numpy as np arr = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]]) print(arr) ''' [[ 1 2 3 4] [ 4 5 6 7] [ 7 8 9 10]] ''' print(arr.mean()) # 5.5 print(np.mean(arr)) # 5.5 print(arr.mean(axis=1)) # [2.5 5.5 8.5], 2.5=(1+2+3+4)/4 print(arr.sum()) # 66 print(arr.sum(0)) #[12 15 18 21]
用于布尔数组的方法
import numpy as np from numpy.matlib import randn arr = randn(100) print((arr>0).sum()) #正数的个数 bools = np.array([False,True,True,False,False]) # any检查是否存在一个或者多个True print(bools.any()) # True # all检查是否都是True print(bools.all()) # False
排序
import numpy as np arr = np.array([4,3,6,1,2,9]) arr.sort() print(arr) # [1 2 3 4 6 9] arr_2d = np.array([[4,3,6,1,2,9],[4,7,4,5,6,7],[10,4,2,5,3,9]]) arr_2d.sort() print(arr_2d) ''' [[ 1 2 3 4 6 9] [ 4 4 5 6 7 7] [ 2 3 4 5 9 10]] ''' # 多维数组可以在任何一个轴向上进行排序,只需要将编号传给sort即可 arr_2d2 = np.array([[5,4,3,2,1],[4,3,2,1,0],[9,8,7,6,5],[1,1,1,5,2]]) arr_2d2.sort(0) print(arr_2d2) ''' [[1 1 1 1 0] [4 3 2 2 1] [5 4 3 5 2] [9 8 7 6 5]] '''
唯一化以及其他的集合逻辑
- 数组的集合运算
- unique(x):计算x中的唯一元素
- intersect1d(x,y):计算x和y中的公共元素
- union1d(x,y):计算x和y的并集
- in1d(x,y):得到一个表示“x元素是否包含于y”的布尔型数组
- setdiff1d(x,y):集合的差,x元素不在y中
- setxor1d(x,y):集合的对称差,即存在于一个数组中但是不同时存在于两个数组中的元素
import numpy as np names = np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe']) print(sorted(set(names))) # 去重 ['Bob' 'Joe' 'Will'] print(np.unique(names)) # 去重 ['Bob' 'Joe' 'Will'] arr1 = np.array([1,2,3]) arr2 = np.array([2,3,4]) # unique(x):计算x中的唯一元素 print(np.union1d(arr1,arr2)) # [1 2 3 4] # intersect1d(x,y):计算x和y中的公共元素 print(np.intersect1d(arr1,arr2)) # [2 3] # in1d(x,y):得到一个表示“x元素是否包含于y”的布尔型数组 print(np.in1d(arr1,arr2)) # [False True True] # setdiff1d(x,y):集合的差,x元素不在y中 print(np.setdiff1d(arr1,arr2)) # [1] # setxor1d(x,y):集合的对称差,即存在于一个数组中但是不同时存在于两个数组中的元素 print(np.setxor1d(arr1,arr2)) # [1 4]