zoukankan      html  css  js  c++  java
  • python数据分析

    .ndim 秩 就是轴的数目或者维度的数量
    .shape ndarray对象的尺度,对于矩阵就是n行,m列
    .size代表元素的个数 n*m的值
    .dtype ndarray对象元素类型
    .itemsize ndarray对象中每个元素的大小.以字节为单位

    ndarray数组的创建方法
    1 从python中的列表、元组等类型中创建nadarray数组
    x=np.array(list/tuple)
    x=np.array(list/tuple,dtype=np.float32)
    当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型。
    np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
    np.ones(shape)根据生成一个全1的数组,shape是元组类型
    shape=(4,4)代表生成一个4*4全1矩阵
    np.zeros(shape)根据shape生成一个全0的数组,shape是元组类型
    np.full(shape,val)根据shape生成一个数组,每个元素值都是val
    np.eye(n)生成一个n*n的单位矩阵,对角线元素都是1,其余的都是0

    np.ones_like(a)根据数组a的形状生成一个全1的数组
    np.zeros_like(a)根据数组a的形状生成一个全0的数组
    np.full_like(a,val)根据数组a的形状生成一个数组,每个值都是val

    a=np.linespace(1,10,4)代表起始元素是1,终止元素是10,被分割成4个数
    a=np.linespace(1,10,4,endpoint=False)代表最后一个数是不是作为元素放入,这样生成的数默认是浮点类型
    np.concatenate((a,b))合并

    a=np.reshape(shape)其中np的size是满足shape各个维度元素的乘积总和的
    np.resize直接把np改变,不返回
    b=np.swapaxes(0,1)直接交换第一维和第二维,维度默认从0开始
    np.flatten()数组降成一维的

    a=np.ones((2,3,4),dtype=np.int)
    astype()
    astype()方法一定会创建一个新的数组(原数据的一个拷贝),即使两个类型一致
    ndarray()转列表
    Is=a.tolist()数组向列表转换

    ndarray索引和切片都是支持的
    a[1:4:2]
    启示元素1,1:4代表下标为1-3的元素,每次取的步长是2

    多维数组索引和切片
    a=np.arange(24).reshape((2,3,4))
    访问使用逗号分割维度数,a[1,2,3]
    多维数组切片
    print(a[:,1,-3])
    表示无视第一个维度,第二个维度下标是1,第三个维度下标是-3的元素
    冒号选取维度,每个维度的切片方法和一维数组相同

    np.mean()元素的平均值
    np/np.mean()数组和标量之间的运算

    np.abs(x) np.fabs(x)计算数组的各个元素之间的绝对值
    np.sqrt()计算数组元素平方根
    np.square()计算各个元素的平方
    np.log(x)自然对数
    np.log10(x)10为低对数
    np.log2(x)2为底的对数
    np.ceil(x) np.floor(x)向上向下取正
    np.rint(x)计算数组各个元素的四舍五入的值
    np.modf(x)将数组各个元素的小数和整数部分以两个独立数组的形式返回
    np.cos(x) np.cosh(x)
    np.sin(x) np.sinh(x)
    np.tan(x) np.tanh(x)
    np.exp(x)计算数组各个元素的指数值
    np.sign(x)各个元素的符号值

    NumPy的二元函数
    np.maximum(x,y) np.fmax()元素的最大值最小值

    数据CSV文件
    生成CSV文件

    np.savetxt(frame,array,fmt='%.18e',dekimiter=None)
    frame:文件、字符串或产生器,可以是.gz或者.bz2的压缩文件
    array:存入文件的数组。
    fmt:写入文件的格式,列如:%d :2.f %.18e
    delimiter:分割字符串,默认是任何空格
    np.save(''a.csv',a,fmt='%d',delimiter=',')

    np.load(frme,dtype=np.float,delimiter=None,impack=Flase)
    frame:文件、字符串或产生器,可以是.gz.bz2的压缩文件
    dtype:数据类型可选。
    delimiter分割字符串,默认是任何空格
    unpack:如果是Ture,读入的属性将分别写入不同的变量

    不足CSV只能存取一维,和二维数据的存取
    a.tofile(frame,sep='',format='%s')
    frame:文件、字符串
    sep:数据分割字符串、如果是空串、写入文件是二进制
    format写入文件的数据格式

    np.fromfile(frame,dtype=float,count=-1,sep='')
    frame:文件,字符串
    dtype:读取数据类型
    count:读入元素的个数,-1表示读入整个文件
    sep数据分割字符串、如果是空串,写入文件为二进制。

    sum(a,axis=None)
    根据给定轴axis计算数组a相关元素的和,axis整数或者元组

    mean(a,axis=None)根据给定轴axis计算数组a的相关元素的期望,axis整数或者元组

    average(a,axis=None,weights=None) 根据给定轴axus计算数组a相关元素的加权平均值

    str(a,axis=None) 根据给定轴axis计算数组a相关元素标准差
    var(a,axis=None)根据给定轴axis计算数组a相关元素的方差

    min(a) max(a)计算数组a中元素的最小值和最大值
    argmin(a) argmax(a)计算数组a中元素最小值和最大值将一维后的下标
    unravel_index(index,shape)计算数组a中元素的最大值和最小值的差
    ptp(a) 计算数组a中元素最大值和最小值的差
    median(a)计算数组中的中位数

  • 相关阅读:
    梦断代码读后感02
    UML大战需求与分析--阅读笔记4
    UML大战需求分析--阅读笔记3
    软件需求与分析课堂讨论一
    UML大战需求分析--阅读笔记02
    UML大战需求分析--阅读笔记01
    学习进度--大三下
    问题账户需求分析
    2016年秋季阅读计划
    个人总结
  • 原文地址:https://www.cnblogs.com/bluefly-hrbust/p/11839086.html
Copyright © 2011-2022 走看看