zoukankan      html  css  js  c++  java
  • R语言的学习(四)

    一、直方图
    hist(x, breaks = "Sturges", freq = NULL, probability = !freq, include.lowest = TRUE, right = TRUE, density = NULL, angle = 45, col = NULL, border = NULL, main = paste("Histogram of" , xname), xlim = range(breaks), ylim = NULL, xlab = xname, ylab, axes = TRUE, plot = TRUE, labels = FALSE, nclass = NULL, warn.unused = TRUE, ...)
    二、核密度函数
    与直方图相配套的是核密度估计函数density(),作用是已知其样本,估计其密度
    使用方法:
    density(x,bw="nrdo",adjust=1,kernel=c("guassian","epanechnikov","rectangular","triangular","biweight","cosine","optosine"),
    windoe=kernel,width,
    give.Rkern=FALSE,
    n=512,from,to,cut=3,na.rm=FALSE)
    其中x是由样本构成的向量,bw是带宽,当bw为省略值时,R软件会画出光滑的曲线

    核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属於非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基于数据集密度函数聚类算法提出修订的核密度估计方法。

    w<-c(75.0,64.0,47.4,66.9,62.2,66.2,58.7,63.5,66.6,64.0,57.0,69.0,56.9,50.0,72.0)
    > hist(w,freq=FALSE)
    > lines(density(w),col="blue")
    > x<-44:76
    > lines(x,dnorm(x,mean(w),sd(w)),col="red")

    freq:TRUE是绘出频率直方图

           counts是绘出频率直方图

           FALSE是绘出密度直方图

    蓝色的线是核密度估计曲线,红色的线是正态分布的概率密度曲线

    三、经验分布

    直方图的制作适合于总体为连续分布的场合,对于一般的总体分布,若要估计它的 总体分布函数F(x),可用经验分布函数做估计

    用法:

    ecdf(x)

    plot(x,verticals=FALSE)

    verticals为FALSE为不画竖线,为TRUE为画竖线,

    ex:

    plot(ecdf(w),verticals=TRUE,do.p=FALSE)
    > x<-44:78
    > lines(x,pnorm(x,mean(w),sd(w)))
    do.p为FALSE代表不画点处的记号,TRUE或缺省画记号

    四QQ图

    不论是直方还是经验分布图,要从比较上鉴别样本是否近似于某种类型的分布是困难的,QQ图可以帮助我们鉴别样本的分布是否近似于某种类型的分布

    R软件中提供了画正态QQ图和相应直线的方法

    qqnorm(y,...)

    qqnorm(y,ylim,main="Normal Q-Q plot",

                xlab="Theoretical Quantiles",

                ylab="Sample Quantiles",plot.it=TRUE,

                datax=FALSE,...)

    qqline(y,datax=FALSE,...)

    qqplot(x,y,plot.it=TRUE,xlab=deparse(substitute(x)),

              ylab=deparse(substitute(y)),...)

    #deparse:Turn unevaluated expressions into character strings.

    EX:

    w
    [1] 75.0 64.0 47.4 66.9 62.2 66.2 58.7 63.5 66.6 64.0 57.0 69.0 56.9 50.0
    [15] 72.0
    > qqnorm(w);qqline(w)

    从正态QQ图来看,样本的数据基本可以看成来自正态总体

    对于对数正态,指数等分布也可以做相应的QQ图,用以鉴别数据知否来自某一类型的总体分布

  • 相关阅读:
    wait waitpid
    达梦备份还原
    sigprocmask阻塞信号
    sigaction信号处理
    dd命令
    linux系统启动过程
    cpio建立、还原备份档
    configure详解
    Git入门基础教程
    一篇文章了解Github和Git教程
  • 原文地址:https://www.cnblogs.com/biong-blog/p/4317590.html
Copyright © 2011-2022 走看看