zoukankan      html  css  js  c++  java
  • R语言绘制箱型图

    箱形图是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图,

    比较数据集中的数据分布也很有用。

    R中的盒形图通过使用boxplot()函数来创建。

    基本公式为:

    boxplot(x, data, notch, varwidth, names, main)

    x - 是向量或公式。data - 是数据帧。notch - 是一个逻辑值,设置为TRUE可以画出一个缺口。
    varwidth - 是一个逻辑值。设置为true以绘制与样本大小成比例的框的宽度。names - 是将在每个箱形图下打印的组标签。
    main - 用于给图表标题。

    > A <- c(79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04)
    > B <- c(80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95)
    > boxplot(A,B,notch=T,names=c('A','B'),col=c('green','yellow'))

    五数总括

    在探索性数据分析中,最有代表性,能反映数据特征的的五个数:上四分为数,下四分为数,中位数,最小值和最大值

    R语言中,使用函数fivenum(x,na.rm=TRUE)来计算五个数,na.rm=TRUE,代表数据集中缺失值的时候,舍去

    > fivenum(A)
    [1] 79.980 80.025 80.030 80.040 80.040
    > fivenum(B)
    [1] 79.94 79.96 79.97 80.00 80.03

  • 相关阅读:
    C# STUDY
    C# 通过线程来控制进度条(转)--讲解多线程对界面的操作
    Android开发问题笔记
    win7 Android环境搭配
    Git-Flow
    Synchronizing with Remote Repositories
    smartgit document merge
    smartgit document Rebase
    手把手教你玩转Git分布式版本控制系统!
    (二)代理模式详解(包含原理详解)
  • 原文地址:https://www.cnblogs.com/ConnorShip/p/9869463.html
Copyright © 2011-2022 走看看