机器学习的最基础模块就是numpy模块了,而numpy模块中的数组操作又是重中之重,所以我们要把数组的各种方法弄得明明白白的,以下就是数组的一些常用方法
1.创建各种各样的数组:
import numpy as np import matplotlib.pyplot as plt print(np.zeros(10)) #一维全零数组 print(np.zeros((3,3),dtype=np.int)) #多维tupple数组 3行3列 可以加数据类型 print(np.ones(10)) #一维全1数组 print(np.ones((4,4))) #多维全1数组 print(np.full((3,5),8)) #可以指定数组元素的值 print(np.identity(4)) #创建单位矩阵 print(np.eye(4,4,1)) #4行4列单位矩阵 对角线从下标1开始 print(np.array([1,23,4,'ltf','fjf'])) #可以随便传入数据 一维数组 print(np.array([[1,2,3],['ltf','lsq','fjf'],['男','女','人妖']])) #多维数组,随便定义、 a=np.array([[1,2,3],[4,3,6]]) b=np.full_like(a,3.2) c=np.ones_like(a) print(b) print(c) #根据一个向量创建斜对角线方阵 也可以指定对角线位置 arr2d=np.diag([1,2,3,4]) print(arr2d) print(np.arange(1,6)) #类似于range 不包含上界 print(np.arange(1,10,2)) #开始 结束 步长 print(np.linspace(1,10,4)) #开始 结束 个数 print(np.logspace(1,4,4)) #分为4个等分点,形成数组【1,2,3,4】然后形成 对数的底数的指数 print(np.logspace(1,5,5,base=2)) #指定对数为2 #创建坐标系 其实可以用plt.show() x=np.linspace(0,1,5) y=np.linspace(0,1,3) xv,yv=np.meshgrid(x,y) print(xv) print(yv) plt.plot(xv,yv,'^') plt.show() #指数图 x=np.arange(-5,5,0.1) y=np.power(2,x) #print(y) plt.plot(x,y) #对数图 x=np.power(2,x) y=np.log2(x) plt.plot(x,y) plt.show() x1=np.arange(1,5,1) y1=np.power(x1,3) #x1的3次方 print(y1) x2=np.array([1,8,27,64]) y2=np.power(x2,1/3) #x2的1/3次方 print(y2)
2.数组的复制等各种操作
import numpy as np #1 赋值 改变原数组 a=np.array([1,2,3,4,5]) b=a b[0]=100 print(b) print(a) #2 拷贝 不改变原数组 a1=np.array([1,2,3,4,5]) b1=np.copy(a1) b1[0]=20 print(a1) print(b1) #3 修改 arry=np.array([1,2,3,4,5]) #arry[2]=10 arry[0:2]=8 #包头不包尾 print(arry) arr1=np.array([[1,2,3,4],[5,6,7,8]]) print(arr1.T) #数组的转置 arr1.shape=4,2 print(arr1) #简单分隔 #4 分隔 arr2=np.arange(0,20,1) print(arr2.reshape(4,5)) newarr2=arr2.reshape(4,5) newarr2[0:2,0]=8 #0行1行 的0列 为8 print(newarr2) #5 newarr3=np.reshape(newarr2,(1,-1)) #行数为1, 列数 待定 print(newarr3) newarr4=np.reshape(newarr2,(-1,1)) #列数为1, 行数 待定 print(newarr4) newarr5=newarr3[0][:,np.newaxis] #取第一行 即一维数组 在变成一列 print(newarr5) #6 二维数组转一维数组 arr2d=np.arange(1,21,1).reshape(4,5) #4行5列 print(arr2d) arr2d1=np.ravel(arr2d) print(arr2d1) #arr2d1和arr2d共享同一块内存 print(arr2d.flatten()) #不共享内存 #7 resize使用 arrresize=np.resize(arr2d,(5,2)) #5行2列 本来有20个元素 只取其中的10个也可以 不像reshape必须全取 print(arrresize) #8 转置 多维转换置换 arr3d=np.arange(1,28,1).reshape(3,3,3) print(arr3d) arr3d1=np.transpose(arr3d) print(arr3d1)
3.数组的修改等各种操作
import numpy as np #1.访问二维数组 a=np.arange(1,16,1).reshape(3,5) #3行5列数组 print(a) print(a[1]) #访问第一行 print(a[1,1]) #访问第一行第一列的元素 print(a[1][1]) #访问第一行第一列的元素 #2.访问二维数组部分元素 print('-'*20) b=np.arange(1,16,1).reshape(3,5) #3行5列二维数组 print(b) print(b[0:1,2:4]) #第一行下标为2和下标为3的元素 print(b[:,3]) #所有行下标为3的列数的所有元素 print(b[:,2:5]) #所有行,2,3,4列元素 #3.删除元素 print('-'*20) c=np.arange(1,16,1).reshape(3,5) #3行5列二维数组 print(c) print(np.delete(c,1)) #删除行号 返回一位数组 print(np.delete(c,[2,3,8,9])) #返回一位数组 删除下标为2,3,8,9的元素 #4.删除列元素 print('-'*20) d=np.arange(1,16,1).reshape(3,5) #3行5列二维数组 print(d) print(np.delete(d,1,axis=0)) #删除下标为1这一行 print(np.delete(d,[2,3],axis=1)) #删除下标为2和3 的这两列 #5.插入元素 print('-'*20) e=np.array([[1,2],[3,4],[5,6]]) print(e) print(np.insert(e,1,5)) #返回一维数组 把5插入到1号索引后 print(np.insert(e,1,5,axis=1)) #插入一列 该列元素全为5 print(np.insert(e,1,[0,2,5],axis=1)) #插入一列 为0,2,5 print(np.insert(e,len(e),[[7,8]],axis=0)) #在最后一列插入一行 print(np.c_[e,np.array([1,1,1])]) #在最后一行后面加一列 print(np.append(e,[[7,8]],axis=0)) #append追加一列
4.数组的组合拼接等等
import numpy as np #1.数组的行拼接 a=np.array([[1,2],[3,4]]) b=np.array([[5,6]]) c=np.concatenate((a,b),axis=0) #axis=0 按行 d=np.vstack((a,b)) #行 方法 print(c) print(d) #2.数组的列拼接 a=np.array([[1,2],[3,4]]) b=np.array([[5],[6]]) c=np.concatenate((a,b),axis=1) #axis=1 按列 要求具有同样的列数 d=np.hstack((a,b)) #列方法 print(c) print(d) #3.竖直方向将二维数组拆分成若干个数组 a=np.arange(1,21,1).reshape(4,5) b=np.split(a,2) c=np.vsplit(a,2) print(b) print(c) #4.水平方向将二维数组拆分成若干个数组 a=np.arange(1,21,1).reshape(4,5) b=np.hsplit(a,5) print(b)
5.数组的查找,排序,统计
import numpy as np #1.检查符合条件的元素 a=np.array([1,0,0,3,4,5,0,8]) b=np.nonzero(a) print(b) #不为0的下标 c=a[b] print(c) #输出不为0的元素 1,3,4,5,8 #2.二维数组查找 a=np.array([[1,2,0],[4,0,6],[0,8,9]]) b=np.nonzero(a) c=a[b] print(c) #输出一维数组1,2,4,6,8,9 #3.查找指定条件 a=np.arange(10) print(a) b=np.where(a>5) print(a[b]) #查找大于5的 #4.返回条件为true a=np.arange(5) b=np.array([True,False,True,True,False]) print(a[b]) #输出0,2,3 print(b[a]) #5.返回指定索引的若干个元素 a=np.array([4,3,5,7,6,8]) b=np.take(a,[0,1,4]) #返回索引为0,1,4的元素 print(b) #5.数组排序 a=np.arange(5) print(a[::-1]) #倒序,,-1指定步长为-1 倒数 b=np.array([3,4,1,8,4,9,5,6,9]) print(np.sort(b)) #一维数组排序 a=np.array([[3,1,5],[2,4,0]]) print(a) b=np.sort(a,axis=0) #沿着行索引增加方向排序,也就是对每一列排序 print(b) c=np.sort(a,axis=1) #沿着列索引增加方向排序,也就是对每一行排序 print(c) #5.分界线排序 a=np.array([30,20,40,50,10,80,50,40,90,76]) b=np.partition(a,0) print(b) #小于30的在左边 大于30的在右边 等于也在右边 c=np.partition(a,6) print(c) #小于50的在左边 大于50的在右边 等于也在右边 #6.数组统计 a=np.array([1,3,6,2,5,9,8,10,4]) print(a.max()) #最大值 print(np.max(a)) #最大值 print(np.min(a)) #最小值 a=np.arange(1,11,1).reshape(2,5) #2行5列2维数组 print(a) print(np.max(a)) #所有元素里面的最大值 print(np.max(a,axis=0)) #行索引 找出每一列的最大值 print(np.max(a,axis=1)) #列索引 找出每一行的最大值 a=np.array([[1,3,9],[2,5,4],[6,7,8]]) print('-'*20) print(np.max(a,axis=0)) #行索引 找出每一列的最大值 print(np.max(a,axis=1)) #列索引 找出每一行的最大值 #查找极值元素的索引 a=np.array([1,2,0,4,5,3,7,9]) print(np.argmax(a)) #索引号 7 print(np.argmin(a)) #索引号 2 a=np.array([[1,2,3],[6,5,4],[9,7,8]]) #3行3列 print(a) print(np.argmax(a)) print(np.argmax(a,axis=0)) #每一列最大元素的索引 print(np.argmax(a,axis=1)) #每一行最大元素的索引 #计算数组平均值 a=np.arange(1,13,1).reshape(3,4) print(a) print(np.mean(a)) #输出 所有数的和的平均值 print(np.mean(a,axis=0)) #每一列的平均值 print(np.mean(a,axis=1)) #每一行的平均值 #计算数组加权平均值 a=np.arange(1,11) print(a) #输出1-11的十个数 print(np.mean(a)) #没加权重 b=np.average(a,weights=np.array([1,3,1,0,0,1,1,0,1,2])) #这是加了权重 print(b)
附上GitHub地址:
https://github.com/tyutltf/numpy_array_basic