zoukankan      html  css  js  c++  java
  • R_Studio(学生成绩)对数值型数据进行统计量分析

      对“Gary.csv”中的成绩数据进行统计量分析

     基础数据分析

      均值 中位数 极差   标准差   变异系数 1/4分位数 3/4分位数 四分位间距... ...分析

    setwd('D:\data')                            #更改工作目录
    list.files()                                #列出当前工作目录下的文件
    dat=read.csv(file="Gary.csv",header=TRUE)    #读取"Gary.csv文件"
    
    dats=dat[,3]     #对大学体育成绩进行分析
    
    # 统计量分析
    #平均分
    mean_ = mean(dats,na.rm=T)
    # 中位数
    median_ = median(dats,na.rm=T)
    # 极差
    range_ = max(dats,na.rm=T)-min(dats,na.rm=T)
    # 标准差
    std_ = sqrt(var(dats,na.rm=T))
    # 变异系数
    variation_ = std_/mean_
    # 四分位数间距
    q1 = quantile(dats,0.25,na.rm=T)
    q3 = quantile(dats,0.75,na.rm=T)
    distance = q3-q1
    a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)
    colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距")
    print(a) 
    Gary.R

     平均值mean(x, trim = 0, na.rm = FALSE, ...)  传送门

       x - 是输入向量。

      trim - 用于从排序的向量的两端删除一些观测值。

        na.rm - 用于从输入向量中删除缺少的值。

    中位数median(x, na.rm = FALSE) 

       x - 是输入向量。 

      na.rm - 用于从输入向量中删除缺少的值。

    其它数据分析方法  

      线性回归  传送门

      多元回归

      逻辑回归

      正态分布  传送门

      二项分布  传送门

      泊松回归  传送门

      协方差分析

      时间序列分析

      非线性最小二乘法

      决策树  传送门

      随机森林

      生存分析卡方检验

    (如需转载学习,请标明出处)
  • 相关阅读:
    用C#来开发CAD插件,含源代码
    C#自定义工业控件开发
    判断点是否在多边形内部
    在C#中使用属性控件添加属性窗口
    Java TreeMap 介绍和使用
    Java中异常处理之try和catch代码块的使用
    Class.forName()的作用与使用总结
    web.xml文件详解
    Java中普通代码块,构造代码块,静态代码块区别及代码示例
    详解JSP九个内置对象
  • 原文地址:https://www.cnblogs.com/1138720556Gary/p/9651354.html
Copyright © 2011-2022 走看看