操纵数据:构建子集(subsetting)
原始数据(raw dataset) => 预处理后的数据(clean dataset)
1. 基本方法
- [ ]:提取一个或多个类型相同的元素
- [[ ]]:从列表或数据框中提取元素
- $:按名字从列表或数据框中提取元素
2. 矩阵的子集
3. 数据框的子集
4. 列表的子集
- [[]] / $ / [[]] / [[]][[]]
- 嵌套列表 / 不完全匹配(partial matching)
5. 处理缺失值
6. 向量化操作(vectorized operation)
- 可以作用于向量、矩阵等结构,使得代码简洁、易于阅读、效率高
7. 小结