zoukankan      html  css  js  c++  java
  • R中的基本函数运算

    一、均值

    1.均值:mean(X)#计算所有元素的均值,包括矩阵、向量

    2.行均值:apply(x,1,mean)

    3.行均值:apply(x,2,mean)

    注:如果x是数据框,则返回的就是向量

    ex:mean(as.data.frame(x))

    在做多元数据分析时,多元数据输入最好使用数据框的方式输入

    4.在计算中某些数据是异常的,参数trim可以减少输入误差对计算的影响

    ex:w.mean<-mean(w,trim=0.1)

    0.1表示计算均值前需要去掉异常值的比例

    5.有缺失值的时候无法计算均值,加上参数na.rm=TRUE可以计算有缺失值的均值

    ex:w.mean<-mean(w.na,na.rm=TRUE);w.mean

    6.加权向量

    weight.mean(x,w,na.rm=TRUE)

    x:数值向量

    w:权值

    二、顺序统计量

    1.顺序排序

    sort(x)

    2.更广泛的功能

    格式:sort(x,partial=NULL,na.last=NA,decreasing=FALSE,method=c("shell","quick"),index.return=FALSE)

    partial:部分排序的指标向量

    na.last:=NULL:不处理缺失数据;=FALSE缺失数据排在最后面;=TRUE缺失数据排在最前面

    method:选择排序的方法。shell排序的复杂度为N的4/3次方,quick是快速排序

    index.return:逻辑变量,TRUE为返回排序下标及排序结果,缺省为FASLE

    decreasing:为TRUE时排序从大到小

    三、中位数

    中位数描述的是数据中心位置的数字特征,大体上比中位数或大或小的数据个数占整个数据的一半,对称分布的数据均值与中位数比较接近,偏态分布均值与中位数不同,中位数不受异常值的影响,具有稳健性

    median(x,na.rm=TRUE):计算向量x的中位数,可处理有缺失值的数据

    四:百分位数

    quantile(x,probs=seq(0,1,0,25),na.rm=FASLE,names=TRUE,type=7,...)

    probs:分位位置

    五:方差、标准差、变异系数

    变异系数是刻画数据相对分散性的一种度量记为CV=100*(s/x~)(%),x~为均值

    方差:var(x)

    标准差:sd(x)

    协方差:cov(x)

    相关矩阵:cor(x)

    变异系数:cv=100*sd(x)/mean(x);cv

    校正平方和:css=sum((w-mean(w))^2);css

    未校正平方和:uss=sum(w^2);uss

    样本极差:R=max(x)-min(x);R

    样本标准误:sm=sd(x)/sqrt(length(x))

    样本偏度系数:g1=n/((n-1)*(n-2))*sum((x-m)^3)/(sd(x))^3

    样本峰度系数:g2=(n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3))#s=sd(x)

  • 相关阅读:
    POJ-1004-Finanical Management
    POJ-1003-hangover
    第一次写博客,想了很久要给自己留一个什么样的开始
    从exchange2010上面删除特定主题或特定时间的邮件
    STM32 一个定时器产生4路 独立调频率,占中比可调,脉冲个数可以统计。
    光电耦合
    STM32 定时器级联
    Eclipse 创建新的workspace
    一次提交,多文件上传
    Grid标签计算结果集中的合计行
  • 原文地址:https://www.cnblogs.com/wuzhitj/p/4743535.html
Copyright © 2011-2022 走看看