zoukankan      html  css  js  c++  java
  • R_Studio(学生成绩)对数值型数据进行统计量分析

      对“Gary.csv”中的成绩数据进行统计量分析

     基础数据分析

      均值 中位数 极差   标准差   变异系数 1/4分位数 3/4分位数 四分位间距... ...分析

    setwd('D:\data')                            #更改工作目录
    list.files()                                #列出当前工作目录下的文件
    dat=read.csv(file="Gary.csv",header=TRUE)    #读取"Gary.csv文件"
    
    dats=dat[,3]     #对大学体育成绩进行分析
    
    # 统计量分析
    #平均分
    mean_ = mean(dats,na.rm=T)
    # 中位数
    median_ = median(dats,na.rm=T)
    # 极差
    range_ = max(dats,na.rm=T)-min(dats,na.rm=T)
    # 标准差
    std_ = sqrt(var(dats,na.rm=T))
    # 变异系数
    variation_ = std_/mean_
    # 四分位数间距
    q1 = quantile(dats,0.25,na.rm=T)
    q3 = quantile(dats,0.75,na.rm=T)
    distance = q3-q1
    a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)
    colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距")
    print(a) 
    Gary.R

     平均值mean(x, trim = 0, na.rm = FALSE, ...)  传送门

       x - 是输入向量。

      trim - 用于从排序的向量的两端删除一些观测值。

        na.rm - 用于从输入向量中删除缺少的值。

    中位数median(x, na.rm = FALSE) 

       x - 是输入向量。 

      na.rm - 用于从输入向量中删除缺少的值。

    其它数据分析方法  

      线性回归  传送门

      多元回归

      逻辑回归

      正态分布  传送门

      二项分布  传送门

      泊松回归  传送门

      协方差分析

      时间序列分析

      非线性最小二乘法

      决策树  传送门

      随机森林

      生存分析卡方检验

    (如需转载学习,请标明出处)
  • 相关阅读:
    Vitrualbox虚拟机网络设置
    挂接命令(mount) 【转】
    ubuntu Error mounting /dev/sda6 at /media/xxx...
    mysql命令[转]
    fopen参数
    fprintf&prinft&sprintf
    UNIX 网络编程知识,函数积累
    vim 括号自动补全
    CDbConnection failed to open the DB connection
    [Android_蓝牙]Android4.0蓝牙使能的详细解析
  • 原文地址:https://www.cnblogs.com/1138720556Gary/p/9651354.html
Copyright © 2011-2022 走看看