zoukankan      html  css  js  c++  java
  • R语言基础-数据转换

    一、基本转换

    读取Excel数据



    methods(is) 函数可以查看所有 is 的方法。用于判断数据
    methods(as) 函数可以查看所有的转换方法。

    二、对大数据集,取数据子集

    1.读数据



    两种写法


    2.随机抽样函数 sample()

    对向量抽样

    对数据框抽样,取子集

    3.删除特定数据

    原数据 mtcars

    删除1-5列

    删除mpg列

    4.合并不同的数据集

    美国50个州的数据

    每个周的分区

    合并后的数据集


    或者

    合并前20行和后20行

    注意:

    使用 cbind() 和 rbind() 函数合并矩阵时必须要有相同的行和列数

    5.去除重复行

    使用 duplicated() 函数判断是否为重复值

    使用 unique() 函数直接对数据集去重

    三、数据框的翻转

    使用 t() 函数对mtcars数据进行行和列的翻转

    使用 rev() 函数实现向量倒置

    通过翻转数据框索引的方式实现 women 数据的翻转

    四、数据框数据的替换

    使用 transform() 函数修改列的值


    或者
      women$height <- women$height*2.54
    

    五、数据框的排序

    1.sort() 函数,对向量进行排序


    通过列名对数据框排序

    2.order() 函数,也可对向量进行排序,不过返回的值是索引

    对mtcars数据框中的mpg列进行排序

    反排

    对多个列进行排序

    六、对数据框进行运算

    1.apply() 函数,用于数据框或者矩阵

    lapply() 函数,运算后返回的值是列表

    sapply() 函数,运算后的值返回的是向量

    使用state.center 列表数据

    tapply() 函数,第二个参数是因子

    查看区域有多少个州

    七、数据的去中心化和去标准化处理,消除量纲对数据结构的影响

    数据中心化:

    指数据集中的各项数据减去数据集的均值

    数据标准化:

    指在中心化之后再除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。

    1.案例,对 state.x77 数据绘制热图

      heatmap(state.x77)
    

    非常的不明显,没有意义

    2.使用scale() 函数,实现去中心化和去标准化


  • 相关阅读:
    POJ3613 Cow Relays [矩阵乘法 floyd类似]
    BZOJ 2302: [HAOI2011]Problem c [DP 组合计数]
    BZOJ 1037: [ZJOI2008]生日聚会Party [序列DP]
    BZOJ 1898: [Zjoi2005]Swamp 沼泽鳄鱼 [矩阵乘法]
    Codeforces Round #390 (Div. 2)
    BZOJ 1096: [ZJOI2007]仓库建设 [斜率优化DP]
    BZOJ 1911: [Apio2010]特别行动队 [斜率优化DP]
    BZOJ 1597: [Usaco2008 Mar]土地购买 [斜率优化DP]
    [斜率优化DP]【学习笔记】【更新中】
    BZOJ 2127: happiness [最小割]
  • 原文地址:https://www.cnblogs.com/nnadd/p/12865687.html
Copyright © 2011-2022 走看看