zoukankan      html  css  js  c++  java
  • Python描述性统计numpy

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    from sklearn import datasets,preprocessing
    from sklearn.model_selection import learning_curve
    from sklearn.model_selection import train_test_split,GridSearchCV,cross_val_score
    from sklearn.ensemble import ExtraTreesClassifier
    from sklearn.linear_model import LogisticRegression
    from sklearn.metrics import accuracy_score,classification_report,confusion_matrix
    
    from pandas import read_csv
    data_set=read_csv("Smarket.csv")
    data = data_set.values[:,:]
    
    # 平均数
    np.mean(data_set)
    np.mean(data_set["Lag1"])
    
    # 中位数
    np.median(data_set["Lag1"])
    
    # 方差
    np.var(data_set)
    
    #标准差
    np.std(data_set)
    
    # 极差
    np.ptp(data_set["Lag1"])
    
    
    # 两组数据的相关性矩阵
    np.cov(data_set["Lag1"],data_set["Lag2"])
    
    # 协方差矩阵
    np.corrcoef(data_set["Lag1"],data_set["Lag2"])
    
    # 分位数
    q1=data_set.quantile(0.25)
    q2=data_set.quantile(0.5)
    q3=data_set.quantile(0.75)
    
    # 汇总统计
    data_set.describe()
    
    #显示所有列
    pd.set_option('display.max_columns', None)
    #显示所有行
    pd.set_options('display.max_rows', None)
  • 相关阅读:
    344.反正字符串
    125.验证回文串
    167.两数之和 II
    278.第一个错误的版本
    缓冲流
    Windows10剪贴板不能用
    chapter_21【字节流、字符流】
    属性集
    IO异常的处理
    字符流
  • 原文地址:https://www.cnblogs.com/caiyishuai/p/13270706.html
Copyright © 2011-2022 走看看