zoukankan      html  css  js  c++  java
  • R语言基础-reshape2、tidyr、dplyr包

    一、reshape2包

    数据:氮肥和磷肥的用量对植物生长的影响


    将上图数据做成txt文件


    1.melt() 函数,将宽数据转换为长数据


    转换NP数据集

    2.dcast() 函数,将长数据转换为宽数据


    二、tidyr包

    处理整洁的数据:

    每一列代表一个变量
    每一行代表一个观测
    一个观测值对应的一个变量

    1.宽数据变为长数据


    2.长数据变为宽数据


    三、dplyr包

    1.filter() 函数,截取满足条件的数据

    2.distinct() 函数,用于去除重复行

    3.slice() 函数,用于切出任意行

    4.sample_n() 函数,随机取样

    5.sample_frac() 函数,按比例随机抽样

    6.arrange() 函数,对某一指标进行排序

    倒序

      dplyr::arrange(iris,desc(Sepal.length))
    

    7.select() 函数,对数据取子集

    8.summarise() 函数,对数据进行统计

    链式操作符 %>%

    用于实现将一个函数的输出传递给下一个函数,作为下一个函数的输入

    1.取出mtcars数据集的11-20行

    2.对鸢尾花数据集的特征进行分组


    3.对鸢尾花数据集特征的花萼宽度进行分组统计

    4.mutate() 函数,添加新的一列(花萼和花瓣长度的总和)

    对表格进行整合

    两个数据表


    1.左连接(以左边的表为基础)

    2.右连接

    3.全连接(并集)

    4.半连接(取出交集)

    5.反连接(取出补集)

    对 mtcars 进行数据集合操作

      #添加一个名字列
      mtcars <- mutate(mtcars,Model = rownames(mtcars))
      #截取两个数据集1-20条和10-30条
      first <- slice(mtcars,1:20)
      second <- slice(mtcars,10:30)
      #取两者交集
      intersect(first,second)
      #取并集
      dplyr::union_all(first,second)
      #取非冗余的并集
      dplyr::union(first,second)
      #取 first 的补集
      setdiff(first,second)
      #取 second 的补集
      setdiff(second,first)
  • 相关阅读:
    Windows Server安装Oracle11g R2过程记录
    SQLServer 角色说明-服务器级别角色数据库级别角色
    【windows】【应用】必备软件安装
    程序员修炼之道系列 | 无情的测试
    程序员修炼之道系列 | 版本控制
    程序员修炼之道系列 | 死掉的程序不会说谎
    程序员修炼之道系列 | 可逆性
    TS中 使用deprecated 实现对方法的迭代弃用
    shell脚本(16)-awk命令
    shell脚本(15)-sed命令
  • 原文地址:https://www.cnblogs.com/nnadd/p/12873434.html
Copyright © 2011-2022 走看看