zoukankan      html  css  js  c++  java
  • 数据分析常用函数(1)

    参考链接:https://blog.csdn.net/qq_16234613/article/details/64217337

    1、describe():该函数主要对数据进行一个基本的统计,输出数据的总数量(count)、平均值(mean)、标准差(std)、最小值和最大值(min、max)、分位数(四分位)

    2、sort_values(by="列名/行名"):对该列或该行进行值排序

    对numpy中数组的操作:

    1、numpy.tile(a,(1,2)) :该函数将a扩展成1行2列,如

    2、numpy.argsort(a) 或者 a.argsort():对数组进行升序排序,返回索引值。降序的话可以给a加负号。

    3、a.sum(axis=1)  :a为数组,sum(axis=1)表示每行的数相加,平时不加axis则默认为0,为0表示每列的数相加。

    字典的操作

    1、sorted对字典或者列表的后面一个值排序,

    sorted(dic.items() , key=lambda x:x[1] , reverse=True )

    sorted (dic.items(),key=operator.itemgetter(1) ,reverse=True)

    2、字典的get函数:

    dic.get(key,0)相当于if ……else ,若key在字典dic中则返回dic[key]的值,若不在则返回0。

    读取文件的函数:

    1、os.listdir() 方法:用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。 它不包括 '.' 和'..' 即使它在文件夹中。

     查看各列是否存在空值,True表示有空值

  • 相关阅读:
    Windows下压缩成tar.gz格式
    mysql 创建索引和删除索引
    jQuery鼠标事件
    MySql like模糊查询使用详解
    eclipse不能更改设置tomcat 中的ServerLocation问题
    eclipse安装tomcate插件步骤
    php折线图 布局图
    mysql 存储过程详解 存储过程
    解决Toad for Oracle显示乱码问题
    Readings in Databases
  • 原文地址:https://www.cnblogs.com/Lee-yl/p/8662527.html
Copyright © 2011-2022 走看看