zoukankan      html  css  js  c++  java
  • 表格拼接,融合

    cbind(df1,df2) 横向添加表格,表格变宽,增加列数

    rbind(df1,df2) 纵向添加表格,表格变长,增加行数

    例子:

    表格融合:针对数据框没有很好的保持一致。可用函数R内置的merge() 和dplyr的_join()函数。注:merge()可指定匹配列名,但运行较慢。

    merge(数据框1,数据框2,all= ,[by=,by.x=,by.y= ])

    注:merge()函数会自动寻找两个数据框的共有列,即by=共有列,也可以指定不同名的列即by.x指定左边数据框的依据列,by.y指定右边数据框的依据列。

      all=FALSE时,只将数据框中共有列数值相同的那些行输出,类似两个数据框对共有列取交集。;all=TRUE时取并集,原本在该行没有得数据框值用NA替代。

    例子:

    dat_merge1<-merge(df1,df2,by="x",all=TRUE)

    dat_merge2<-merge(df1,df3,by.x="x",by.y="g")

    dat_merge3<-merge(df1,df4,by=c("x","y"),all=TRUE)

     

    结果:

    dplyr包提供left_join(),right_join(), inner_join(), full_join()四个函数。

    dplyr::full_join()生成两个集合的并集,

     dplyr::inner_join()保留交集key

    dplyr::left_join() 只保留左数据框所有key

    dplyr::right_join()只保留右边数据框所有key

    注:空值填充NA。

    by=c("x"="g"),指定两个数据框对应匹配列。

    在合并过程有列在两个表中同名,但不作为匹配列,值不同,想保留这两列时候,用suffix参数给重复列名加后缀。

    例子:

    dat_join1<-dplyr::left_join(x=df1,y=df2,by="x")

    dat_join2<-dplyr::right_join(x=df1,y=df2,by="x")

    dat_join3<-dplyr::inner_join(x=df1,y=df2,by="x")

    dat_join4<-dplyr::full_join(x=df1,y=df2,by="x")

    dat_join4<-dplyr::full_join(x=df1,y=df2,by="x")

     dat_join7<-dplyr::left_join(x=df1,y=df4,by="x",suffix=c("1","2"))

     

    本文来自博客园,作者:BioinformaticsMaster,转载请注明原文链接:https://www.cnblogs.com/koujiaodahan/p/15359330.html

  • 相关阅读:
    【前端攻略】:玩转图片Base64编码(转)
    Tuxedo入门学习
    未将对象引用设置到对象的实例--可能出现的问题总结
    RapeLay(电车之狼R)的结局介绍 (隐藏结局攻略)
    hdu 4604 Deque
    setsockopt()使用方法(參数具体说明)
    分布式系统浅析
    HDU 1181 变形课
    java中获取系统属性以及环境变量
    哈夫曼树
  • 原文地址:https://www.cnblogs.com/koujiaodahan/p/15359330.html
Copyright © 2011-2022 走看看