zoukankan      html  css  js  c++  java
  • R语言基础-数据转换

    一、基本转换

    读取Excel数据



    methods(is) 函数可以查看所有 is 的方法。用于判断数据
    methods(as) 函数可以查看所有的转换方法。

    二、对大数据集,取数据子集

    1.读数据



    两种写法


    2.随机抽样函数 sample()

    对向量抽样

    对数据框抽样,取子集

    3.删除特定数据

    原数据 mtcars

    删除1-5列

    删除mpg列

    4.合并不同的数据集

    美国50个州的数据

    每个周的分区

    合并后的数据集


    或者

    合并前20行和后20行

    注意:

    使用 cbind() 和 rbind() 函数合并矩阵时必须要有相同的行和列数

    5.去除重复行

    使用 duplicated() 函数判断是否为重复值

    使用 unique() 函数直接对数据集去重

    三、数据框的翻转

    使用 t() 函数对mtcars数据进行行和列的翻转

    使用 rev() 函数实现向量倒置

    通过翻转数据框索引的方式实现 women 数据的翻转

    四、数据框数据的替换

    使用 transform() 函数修改列的值


    或者
      women$height <- women$height*2.54
    

    五、数据框的排序

    1.sort() 函数,对向量进行排序


    通过列名对数据框排序

    2.order() 函数,也可对向量进行排序,不过返回的值是索引

    对mtcars数据框中的mpg列进行排序

    反排

    对多个列进行排序

    六、对数据框进行运算

    1.apply() 函数,用于数据框或者矩阵

    lapply() 函数,运算后返回的值是列表

    sapply() 函数,运算后的值返回的是向量

    使用state.center 列表数据

    tapply() 函数,第二个参数是因子

    查看区域有多少个州

    七、数据的去中心化和去标准化处理,消除量纲对数据结构的影响

    数据中心化:

    指数据集中的各项数据减去数据集的均值

    数据标准化:

    指在中心化之后再除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。

    1.案例,对 state.x77 数据绘制热图

      heatmap(state.x77)
    

    非常的不明显,没有意义

    2.使用scale() 函数,实现去中心化和去标准化


  • 相关阅读:
    PAT A1094 The Largest Generation (25 分)——树的bfs遍历
    PAT A1055 The World's Richest (25 分)——排序
    PAT A1052 Linked List Sorting (25 分)——链表,排序
    PAT A1076 Forwards on Weibo (30 分)——图的bfs
    辅导员
    辅导员面试
    C程序设计
    Excel VBA 基本概念
    Excel函数
    导入excel表的数据到数据库ssh
  • 原文地址:https://www.cnblogs.com/nnadd/p/12865687.html
Copyright © 2011-2022 走看看