zoukankan      html  css  js  c++  java
  • R_Studio(学生成绩)数据相关性分析

      对“Gary.csv”中的成绩数据进行统计量分析

      

      

        

      用cor函数来计算相关性,method默认参数是用pearson;并且遇到缺失值,use默认参数everything,结果会是NA

    相关性分析

      当值r>1时,正相关,一个变量增加或减少时,另一个变量也相应增加或减少

      当值r=1时,无相关,说明两个变量相互独立,有一个变量值无法预测另一个变量值

      当值r<1时,负相关,一个变量增加或减少时,另一个变量也相应减少或增加

     

      相关系数取值范围限于: -1 <= r <= +1

      好严格的对称性

      如果只想看大学体育和大学英语 相关性系数

      小case!

    setwd('D:\data')                            #更改工作目录
    list.files()                                #列出当前工作目录下的文件
    dat=read.csv(file="Gary.csv",header=TRUE) 
    
    cor(dat)
    
    plot(dat)
    
    #大学体育 大学英语 相关性系数
    cor(dat[,1],dat[,2])
    
    #绘图
    plot(dat[,1],dat[,2])
    Gary.R

     可视化相关性分析  传送门

      [1] 使用 symnum() 函数实现可视化

      [2] 使用 corrplot() 函数实现可视化

      [3] 使用 PerformanceAnalytics 包进行可视化

      [4] heatmap 可视化

    (如需转载学习,请标明出处)
  • 相关阅读:
    平台架构设计及市场分析
    编写jQuery插件
    分布式锁
    初探12306售票算法(一)- 理论(转)
    年后跳槽如何准备?(转)
    therefore/so/hence/then/accordingly/Thus
    ignore,neglect,omit,overlook
    OOA/OOD/OOP(转)
    SQL Server里的 ISNULL 与 NULLIF
    稀疏矩阵
  • 原文地址:https://www.cnblogs.com/1138720556Gary/p/9652124.html
Copyright © 2011-2022 走看看