zoukankan      html  css  js  c++  java
  • R(2) sample

     sample: 从整体中挑出部分样本数据函数


     Usage: sample.int(n, size = n, replace = FALSE, prob = NULL)

    • x:可以是R中任何​对象
    • size: 指定在向量中抽取元素的个数
    • replace:默认是F,表示每次​抽取后的数就不能在下一次被抽取;T表示抽取过的数可以继续拿来被抽取
    • prob:概率(probability),默认每一个元素被抽取的概率相等,称为随机抽样,实际中需要抽取的元素未必相等,则通过prob来指定

     示例:

    > sample(x=c("F","T"),size=10,replace = TRUE,prob = c(0.8,0.2))
     [1] "F" "F" "F" "F" "T" "F" "F" "T" "F" "F"

    set.seed():  用于设定随机数种子 


       一个特定的种子可以产生一个特定的伪随机序列,这个函数的主要目的,是让你的模拟能够可重复出现,因为很多时候我们需要取随机数,但这段代码再跑一次的时候,结果就不一样了,如果需要重复出现同样的模拟结果的话,就可以用set.seed()

    > set.seed(111)
    > rnorm(3)
    [1]  0.2352207 -0.3307359 -0.3116238
    > set.seed(111)
    > rnorm(3)
    [1]  0.2352207 -0.3307359 -0.3116238

     括号里的数只是一个编号而已,例如set.seed(100)不应将括号里的数字理解成“一百”,而是应该理解成“编号为一零零的随机数发生”,编号设定基本可以随意。 


     pmax/pmin: p在这里表示parallel,可以理解为对向量进行平行比较


      Usage:  pmax(..., na.rm = FALSE) /  pmin(..., na.rm = FALSE) 

    > x <- sample(c(1:10,NA),4)
    >  x
    [1]  3  1 10  4
    >  pmax(x,5,na.rm = TRUE)
    [1]  5  5 10  5
  • 相关阅读:
    Hadoop伪分布式环境安装
    记一次Xshell配置ssh免密登录时的问题
    HDFS学习笔记二
    HDFS学习笔记一
    十万级百万级数据量的Excel文件导入并写入数据库
    javascript内置对象:Date
    内置对象:Math
    javascript内置对象一:String
    javascript内置对象一: Array数组
    Javascritp 数据结构和二叉树算法
  • 原文地址:https://www.cnblogs.com/tgzhu/p/6746796.html
Copyright © 2011-2022 走看看