1. 对象的五种基本类型(classes of objects)
- 字符(character)
- 数值(numeric:real numbers)
- 整数(integer)
- 复数(complex):1+2i
- 逻辑(logical:True / False)
2. 属性(attribute)
- 名称(name)
- 维度(dimensoins:matrix,array)
- 类型(class)
- 长度(length)
3. 数据结构
- 向量(vector):只能包含同一类型的对象
1. vector()
2. c()
3. as.logical() / as.numeric() / as.character()
- 矩阵(matrix):向量+维度属性(整数向量:nrow,ncol)
1. matrix() :先列后行
2. vector() + dim()
3. cbind(),rbind()
4. attributes()
- 数组(array):与矩阵相似,但是维度可以大于2
- 列表(list):可以包含不同类型的对象
- 因子(factor):
1. 分类数据 / 有序 vs. 无序
2. 整数向量+标签(label)(优于整数向量)
- Male / Female vs. 1 / 2
- 常用于 lm(),glm()
3. 创建因子
- factor()
- table() / unclass()
- 缺失值(missing value)
1. NA / NaN:NaN属于NA,NA不属于NaN
2. NA有类型属性:interger NA,character NA等
3. is.na() / is.nan()
- 数据框(data frame)
1. 存储表格数据(tabular data)
2. 视为各元素长度相同的列表
- 每个元素代表一列数据
- 每个元素的长度代表行数
- 元素类型可以不同
- 日期 与 时间(date,time)
1. 日期:Date
- 距离1970-01-01的天数 / date() / Sys.Date()
- weekdays() / months() / quarters()
2. 时间:POSIXct / POSIXIt
- 距离1970-01-01的秒数 / Sys.time()
- POSIXct:整数,常用于存入数据框
- POSIXlt:列表,还包含星期、年、月、日等信息
3. 字符 => 日期 / 时间
- as.Date()
- as.POSIXct() / as.POSIXlt() / strptime()
4. 小结