一:基础简介
1:介绍
Numpy是高性能科学计算和数据分析的基础包。它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都支持向量化运算,使得这些数学函数能够直接对数组进行操作,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地提高了程序的运算速度。
2:安装方式
pip install numpy
3:引用方式
import numpy as np # 行业内默认起个别名 np
这是官方认证的导入方式,可能会有人说为什么不用from numpy import *
,是因为在numpy当中有一些方法与Python中自带的一些方法,例如max
、min
等冲突,为了避免这些麻烦大家就约定俗成的都使用这种方法。
二:ndarray -多维数组对象
1:ndarray使用方式
import numpy as np # 导入numpy模块
np.array() # 生成ndarray对象
2:ndarray使用优势
(1)如图所示 求商品总价格
方法一:通过for循环 循环出一个个元素
方法二:通过匿名函数 zip做出映射
PS:上述方法都是太麻烦
PS:
(1)此种方式就简单方便很多
3:ndarray是一个多维的数组列表
PS:和列表的区别
- 数组对象内的元素类型必须相同
- 数组大小不可修改
4:常用属性
l1= [ [1,2,3,4],[5,6,7,8]]
res1 = np.array(l1)
res1.T
array([[1, 5], # 行列对换
[2, 6],
[3, 7],
[4, 8]])
PS:其余比较简单 此处不写案例了
5:数据类型
PS:
(1)整型: int32只能表示(-2**31,2**31-1),因为它只有32个位,只能表示2**32个数
(2)无符号整型: 只能用来存正数,不能用来存负数 补充:
(3)astype()方法可以修改数组的数据类型
6:ndarray创建

np.arange(10) array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) # 与python的range一样 顾头不顾尾 np.linspace(2,3,num=5,endpoint=False) ### 在2 3之间平均分成五份 endpoint表示是否要包含尾部 array([2. , 2.2, 2.4, 2.6, 2.8]) np.zeros(10) ### 表示生成多少个0 array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]) np.ones(10) ### 表示生成多少个1 array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]) np.empty([2,3]) ### 随机生成一个数组 array([[4.25e-322, 0.00e+000, 0.00e+000], [0.00e+000, 0.00e+000, 0.00e+000]]) np.eye(5) ### 建立矩阵 array([[1., 0., 0., 0., 0.], [0., 1., 0., 0., 0.], [0., 0., 1., 0., 0.], [0., 0., 0., 1., 0.], [0., 0., 0., 0., 1.]])
7:索引和切片
(1)数组和数字之间的运算
import numpy as np
l1 = [[1,2,3,4],[5,6,7,8]]
res = np.array(l1)
res*2
array([[ 2, 4, 6, 8],
[10, 12, 14, 16]])
(2)数组与数组求和
l2 = [
[1,2,3],
[4,5,6]
]
a = np.array(l2)
# l3数组
l3 = [
[7,8,9],
[10,11,12]
]
b = np.array(l3)
a + b # 对应位置相加(乘除也可以) 数组内部元素必须相等
(3)索引取值
import numpy as np
res = np.arange(10)
res.reshape(5,2) # 生成一个数组 但是数组的行列成绩必须与arange中的数字相等
array([[0, 1],
[2, 3],
[4, 5],
[6, 7],
[8, 9]])
res.reshape(10) 多维变成一维数组
import numpy as np
arr = np.array([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23],
[24, 25, 26, 27, 28, 29]])
arr[3][2] # 列表取值方法
arr[3,2] # 数组取值方法 3表示行索引 2表示列索引
(4)切片
arr = np.array(
[[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23],
[24, 25, 26, 27, 28, 29]]
)
arr[2:4,2:4] # 前面为行索引 后面为列索引
5:布尔型索引
(1)现在有这样一个需求:给一个数组,选出数组种所有大于5的数。
li = [random.randint(1,10) for _ in range(30)]
a = np.array(li)
a[a>5]
执行结果:
array([10, 7, 7, 9, 7, 9, 10, 9, 6, 8, 7, 6])
----------------------------------------------
原理:
a>5会对a中的每一个元素进行判断,返回一个布尔数组
a > 5的运行结果:
array([False, True, False, True, True, False, True, False, False,
False, False, False, False, False, False, True, False, True,
False, False, True, True, True, True, True, False, False,
False, False, True])
----------------------------------------------
布尔型索引:将同样大小的布尔数组传进索引,会返回一个有True对应位置的元素的数组
6:花式索引
(1)花式索引是NumPy用来描述使用整型数组(这里的数组,可以是NumPy的数组,也可以是python自带的list)作为索引的术语,其意义是根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素;如果目标是二维数组,那么就是对应下标的行。
(2)总结起来就一句话 对于不连续的索引取值 可以使用该方法
import numpy as np l1= [ 1,2,3,4,5,6,7,8] res1 = np.array(l1) res1 res1[[1,3,5]] # 花式索引取值 array([2, 4, 6])
三:通用函数
1:能对数组中所有元素同时进行运算的函数就是通用函数
2:能够接受一个数组的叫做一元函数,接受两个数组的叫二元函数,结果返回的也是一个数组
(1)一元函数
函数 | 功能 | |
---|---|---|
abs、fabs | 分别是计算整数和浮点数的绝对值 | |
sqrt | 计算各元素的平方根 | |
square | 计算各元素的平方 | |
exp | 计算各元素的指数e**x | |
log | 计算自然对数 | |
sign | 计算各元素的正负号 | |
ceil | 计算各元素的ceiling值 | |
floor | 计算各元素floor值,即小于等于该值的最大整数 | |
rint | 计算各元素的值四舍五入到最接近的整数,保留dtype | |
modf | 将数组的小数部分和整数部分以两个独立数组的形式返回,与Python的divmod方法类似 | |
isnan | 计算各元素的正负号 | |
isinf | 表示那些元素是无穷的布尔型数组 | |
cos,sin,tan | 普通型和双曲型三角函数 |
(2)二元函数
函数 | 功能 | |
---|---|---|
add | 将数组中对应的元素相加 | |
subtract | 从第一个数组中减去第二个数组中的元素 | |
multiply | 数组元素相乘 | |
divide、floor_divide | 除法或向下圆整除法(舍弃余数) | |
power | 对第一个数组中的元素A,根据第二个数组中的相应元素B计算A**B | |
maximum,fmax | 计算最大值,fmax忽略NAN | |
miximum,fmix | 计算最小值,fmin忽略NAN | |
mod | 元素的求模计算(除法的余数) |
3:数学统计方法
函数 | 功能 | |
---|---|---|
sum | 求和 | |
cumsum | 求前缀和 | |
mean | 求平均数 | |
std | 求标准差 | |
var | 求方差 | |
min | 求最小值 | |
max | 求最大值 | |
argmin | 求最小值索引 | |
argmax | 求最大值索引 |
4:随机数
(1):随机数生成函数在np.random的子包当中
(2):常用函数
函数 | 功能 | |
---|---|---|
rand | 给定形状产生随机数组(0到1之间的数) | |
randint | 给定形状产生随机整数 | |
chocie | 给定形状产生随机选择 | |
shuffle | 与random.shuffle相同 | |
uniform | 给定形状产生随机数组 |