zoukankan      html  css  js  c++  java
  • 第十六节 pandas数据特征的分析探索

    import pandas as pd
    pd.options.display.max_rows = 10  # 设置显示行数
    
    df1 = pd.read_csv(r'E:anacondatestPythonDataPM25Beijing_2009_HourlyPM25_created20140709.csv', encoding='gbk')
    
    # 数值变量的基本描述
    df1.describe(include='all')  # include希望分析哪些变量,如果指定多列,放入一个列表中
    
    # 分类变量的频数统计
    pd.value_counts(df1.类型, sort=False)
    df1.总分.value_counts(bins=10)  # 对总分进行分段统计
    
    # 交叉表/数据透视表
    df1.pivot_table(index=['所在省份', '主管部门'], columns='类型', values='总分', aggfunc=sum)
    
    # 常用的假设检验方法
    '''
    单样本t检验
    两独立样本t检验
    配对t检验
    单因素方差分析
    卡方检验
    相关分析
    回归分析
    非参数以检验方法
    '''
  • 相关阅读:
    测试的种类
    软件测试的原则
    软件测试的目的
    软件测试的对象
    软件的分类
    软件测试
    mysql 视图
    mysql 字段添加以及删除
    mysql 引擎类型
    mysql 数据插入insert
  • 原文地址:https://www.cnblogs.com/kogmaw/p/12563509.html
Copyright © 2011-2022 走看看