R学习第一篇：变量和向量

zoukankan html css js c++ java

R学习第一篇：变量和向量
R是向量化的语言，最突出的特点是对向量的运算不需要显式编写循环语句，它会自动地应用于向量的每一个元素。对象是R中存储数据的数据结构，存储在内存中，通过名称或符号访问。对象的名称由大小写字母、数字0-9、点号和下划线组成，名称是区分大小写的，并且不能以数字开头，特殊的对象名称可以通过界定符 `` 来转为合法的对象名称，注意，点号( . ) 被视为没有特殊含义的单字符。

R语言非常灵活，例如：
- R语言区分大小写，不管是变量名和函数名，都是大小写敏感的。
- 直接给变量赋值，R中不能显式声明变量和类型；
- 变量的类是可变的，就是说，同一个变量可以存储字符，也可以存储日期和时间，也可以存储数值。
- R语句的分隔符是分号“;”，或换行符，当语句结束时，可以不使用分号“;”，R语言会自动识别语句结束的位置。
- R语言只支持单行注释，注释由符号#开头，当前行出现在#之后的任何文本都会被R解释器忽略。
- R支持向量化运算。
R语言拥有强大的数据处理和绘图功能，还是免费的，是数据分析人员必学必会的一门语言。

一，变量是什么样子？

首先，我们学习变量的用法，变量用于临时存储数据，以便重用。在R语言中，变量可以直接赋值，跟C、Java等语言不同，R的变量不能声明，因为R没有这个概念。变量名是大小写敏感的，变量名可以包含字符、数字、点和下划线，对于包含特殊字符的变量名，需要使用 `` 把名称转换位有效的变量名，例如：
dataset$`#Visitors (T3M)`
用户可以使用make.names() 获得一个有效的变量名。为变量赋值的操作符是：<- 或 =，建议使用<- 作为变量的赋值符号，以下代码为变量v赋值，并输出变量的值：
> v<-3 > v [1] 3
注意，输出结果[1]，表明从变量的第一个元素开始显示，这意味着，变量实际上是一个向量，R语言中不存在标量类型，最小的数据类型是向量，而向量是一系列有序的值。R按照序列的顺序，逐个打印向量的各个元素。

函数print用于输出变量的值，在控制台中，可以直接输入变量名，控制台自动调用print函数打印变量的值。

如果想把赋值和打印处于写在同一行中，可以把赋值语句写在()中，这样，就能在同一行中完成变量的赋值和打印：
>(v<-3) [1] 3
1，变量的常用通用类

R中所有的变量都属于特定的类（class），类用于表示变量属于的类型（type），可以认为类（class）和类型（type）相同，常用的通用类是：
- 数值：integer，numeric
- 字符：character，使用单引号或双引号
- 日期和时间：日期的类型是Date，时间是POSIXct、POSIXt
- 逻辑：logical，有效值是：TRUE和FALSE
用户可以通过class(variable)函数查看变量的类型：
> v <- 1:3 > v [1] 1 2 3 > class(v) [1] "integer"
变量可以存储任何数据类型，也可以存储任何数据对象，例如，函数，分析的结果以及一个图形。单个变量在某时刻取值为一个数字，而后可以被赋值为字符，还可以被赋值为其他数据类型。

2，变量的类检查和类转换

通过is.* 函数检查变量的类型，通过as.*函数转换变量的类型
> vc <- c('1','2','3') > is.character(vc) [1] TRUE > vi <- as.integer(vc) > is.integer(vi) [1] TRUE
3，变量的删除

在R中，创建变量会占用系统的存储空间，而删除变量会释放存储空间；为了确保存储空间的及时释放，可以使用gc函数，强制系统回收垃圾，释放操作系统中不再使用的存储空间，R也会自动周期性地执行垃圾回收。使用rm函数把变量从当前的作用域中删除：
> rm(variable)
> gc()
4，NULL值和NA值

NULL是个特殊值，表示未知值，NA表示缺失值，NULL和NA之间最大的区别是：NA是一个标量值，长度为1，而NULL不会占用任何空间，长度为零：
> length(NA) [1] 1 > length(NULL) [1] 0
使用is.null函数验证NULL值，使用is.na函数验证NA值：
> is.null(NULL) [1] TRUE > is.na(NA) [1] TRUE
二，向量

向量是R语言中最基本的数据结构，向量是有序的数据序列，序列中的每一个数据项叫做向量的一个元素，同一个向量的元素的数据类型必须是相同的，同一个向量中无法混杂多种不同类型的元素，向量元素可以是数值，字符，逻辑值等。

1，向量的创建

向量（Vector，也叫矢量）是数据的有序序列。函数c把一系列的数据拼接起来，创建一个向量；也可以通过c函数和冒号操作符，创建向量，例如：
> c(1,2,3,4) [1] 1 2 3 4 > c(1:4) [1] 1 2 3 4
也可以通过vector(class,length)函数，创建指定类和长度的向量，向量的每个元素的值是指定类型的默认值，对于数值是0，对于逻辑类是FALSE，对于字符类是空字符串，或NULL。
> vector('integer',3) [1] 0 0 0
R为每个类型都包装了一个创建向量的函数，格式是class_name(length)，例如：
> numeric(3) [1] 0 0 0
2，向量的长度

向量的长度，就是向量包含的元素的个数，通过length函数获取向量的长度
> length(c(1:3)) [1] 3
3，为向量的各个元素命名

R能够为向量的各个元素命名，元素的命名有两种模式，第一种模式是在创建向量时为元素命名，第二种模式是通过names函数为元素命名：
> (v <- c(a=1,b=2,c=3)) a b c 1 2 3 > names(v)<- c('va','vb','vc') va vb vc 1 2 3
输出的结果中，并没有[1]，这说明，无名的向量是按照序列的顺序输出的。names()函数也能获得向量元素的名称，如果向量中没有一个元素有名字，那么names()函数返回NULL。

三，序列

特别地，对于正整数序列，可以使用冒号 : 操作符，该操作符能够产生一个序列，例如 n:m，用于创建从数值n开始，步长为1，依次递增，到数值m结束的有序的数值序列：
> 1:3 [1] 1 2 3
R内置seq函数家族，用于创建整数序列。seq函数用于创建序列，参数分别是开始值（from），结束值（to），步长（by），例如：
seq(from = 1, to = 1, by=step)
seq.int是seq函数的包装，步长不为1的数值序列，可以通过seq.int函数来实现，该函数有三个参数，第一个参数是序列的开始值，第二个参数是序列的结束值，第三个参数默认值是1，用于指定步长。
> seq.int(1,5,2) [1] 1 3 5
函数seq_len(n) 用于创建长度为n的序列，相当于设置seq.int函数的：开始（from）为1，步长（by）为1，终止值（to）为n：
seq_len(2) [1] 1 2
四，索引向量

向量没有维数，这意味着没有列向量或行向量之分。通常情况下，通过下标和[]的组合来访问向量中特定位置的元素，索引向量的格式是v[n]，n 叫做向量的下标，下标是向量元素的位置，第一个元素的位置是1，依次加1。如果下表超出向量的长度范围，不会导致错误，但是向量会返回缺失值（NA）；如果不设置任何下标，那么将返回整个向量的值，R会按照元素在向量中的位置，顺序打印出向量的元素值。除了下标和[] 之外，R还提供其他方式来访问向量的元素：元素名称、逻辑向量。

1，下标为整数或整数向量

当n值为正整数时，返回特定位置的元素的值；当n值为负整数时，不返回特定位置的元素的值；当n值为整数向量时，返回特定位置的元素。
> v <- 1:3 > v[1] [1] 1 > v[-1] [1] 2 3
v[-1]和 v[c(2:3)]返回的元素相同。

2，下标为逻辑向量

当n值为逻辑向量时，返回位置为true的元素的值；
> v[v<=2] [1] 1 2
v[v<=2]和v[c(TRUE,TRUE,FALSE)]返回的元素相同。

3，下标为字符或字符向量

对于元素被命名的命名向量，给向量传入字符向量，命名向量返回指定名字的元素值；
> v <-(a=1,b=2,c=3) > v[c('a','b')] a b 1 2
五，向量元素的位置

向量中包含一系列的数据，如何选择向量中符合条件的元素呢？在上节中，可以通过多种方式来索引向量的元素，如果知道符合条件的元素的位置，那么R就可以使用位置来索引向量的元素值。

1，which函数

which函数用于返回逻辑向量中元素值为TRUE的位置，
> v <- c(1,3,7,2) > v>2 [1] FALSE TRUE TRUE FALSE > which(v>2) [1] 2 3 > v[which(v>2)] [1] 3 7
2，逻辑向量

最简单的方式是使用逻辑向量来索引向量的元素
> v[v>2] [1] 3 7
六，向量的循环

R支持向量化运算，这意味着，运算符或函数能够作用于向量中的每个元素，而无需显式地编写循环语句，这种内置的循环，用于对向量的各个元素执行计算，性能是非常高的。

1，向量和单个数值相加

向量和单个数值n相加，是把向量的每个元素都和单个数值n相加，返回的结果是向量：
> x<-c(1:3) > x+1 [1] 2 3 4
2，向量和向量相加

向量和向量相加的逻辑是在相同的序列位置上，对两个向量的元素相加，返回的结果是向量。在向量和向量做运算时，尽量使两个向量具有相同的长度（length）：
> a=1:3 > b=4:6 > a+b [1] 5 7 9
当两个向量的长度不同时，R会循环短的向量，以配合较长的向量。如果长向量不是短向量的整数倍，R将抛出警告消息。推荐的做法是：对长度相同的两个向量做运算。

七，向量元素的追加，删除和更新

可以向向量中追加元素，例如，向矢量的末尾追加一个元素：
> r <- c(1,3,4) > r[4] <- 5 > r [1] 1 3 4 5
向量不能直接删除特定位置的元素，但是，我们可以通过为向量重新赋值来实现：
> r <- r[r!=4] > r [1] 1 3 5
更新向量特定位置的元素值，只需要为向量的指定元素赋予新值：
> r[3] <- 4 > r [1] 1 3 4
八，向量的排序和排名

排序：使用sort函数对向量进行排序，order函数返回元素在排序之后的位置,v[order(v)]返回和sort(v)相同的结果：
> v <- c(1,3,5,2,4) > sort(v) [1] 1 2 3 4 5 > order(v) [1] 1 4 2 5 3 > v[order(v)] [1] 1 2 3 4 5
排名：rank函数为数据框中的每个元素进行排名，不过rank函数只能作用于向量，只能返回向量元素的排名：
rank(x, na.last = TRUE, ties.method = c("average", "first", "last", "random", "max", "min"))
参考文档：

Quick-R
查看全文

相关阅读:
ORACLE 如何产生一个随机数
 Oracle数据库一些操作信息
 EXP-00091和IMP-00010报错
 ORACLE数据库 memory_target SGA 大小
 linux如何查看端口被哪个进程占用的方法
 命令信息
 Linux负载均衡软件LVS
oracle 字段信息
 oracle数据库的启动与关闭
 idea解除版本控制

原文地址：https://www.cnblogs.com/ljhdo/p/5173674.html

R学习 第一篇：变量和向量

一，变量是什么样子？

二，向量

三，序列

五，向量元素的位置

六，向量的循环

七，向量元素的追加，删除和更新

八，向量的排序和排名

R学习第一篇：变量和向量