zoukankan      html  css  js  c++  java
  • R语言数据框中,用0替代NA缺失值

    1、用0替代数据框中的缺失值NA

    生成数据框:

    复制代码
    > m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
    > d <- as.data.frame(m)
       V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
    1   4  3 NA  3  7  6  6 10  6   5
    2   9  8  9  5 10 NA  2  1  7   2
    3   1  1  6  3  6 NA  1  4  1   6
    4  NA  4 NA  7 10  2 NA  4  1   8
    5   1  2  4 NA  2  6  2  6  7   4
    6  NA  3 NA NA 10  2  1 10  8   4
    7   4  4  9 10  9  8  9  4 10  NA
    8   5  8  3  2  1  4  5  9  4   7
    9   3  9 10  1  9  9 10  5  3   3
    10  4  2  2  5 NA  9  7  2  5   5
    复制代码

    替代数据框中的缺失值

    复制代码
    > d[is.na(d)] <- 0
    
    > d
       V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
    1   4  3  0  3  7  6  6 10  6   5
    2   9  8  9  5 10  0  2  1  7   2
    3   1  1  6  3  6  0  1  4  1   6
    4   0  4  0  7 10  2  0  4  1   8
    5   1  2  4  0  2  6  2  6  7   4
    6   0  3  0  0 10  2  1 10  8   4
    7   4  4  9 10  9  8  9  4 10   0
    8   5  8  3  2  1  4  5  9  4   7
    9   3  9 10  1  9  9 10  5  3   3
    10  4  2  2  5  0  9  7  2  5   5
    复制代码

    2、用0替代变量中的缺失值

    x <- c(1,2,NA,4,5)
    x[is.na(x)] <- 0

     3. 不仅仅是0,同理你还可以赋予其他的数值

    R语言用complete.cases 和 na.omit去除有空值的行

    下面用实例来说明这两个函数的作用:

    这是一个数据框final:
      gene hsap mmul mmus rnor cfam  
    
     1 ENSG00000208234 0 NA NA NA NA  
    
     2 ENSG00000199674 0 2 2 2 2  
    
     3 ENSG00000221622 0 NA NA NA NA  
    
     4 ENSG00000207604 0 NA NA 1 2  
    
     5 ENSG00000207431 0 NA NA NA NA  
    
     6 ENSG00000221312 0 1 2 3 2
    
    如果要去除有NA的行,则可用:
    
    final[complete.cases(final),] 
    
    也可用 na.omit(final)
    
    那么,返回值是
    

       gene hsap mmul mmus rnor cfam  
    
     2 ENSG00000199674 0 2 2 2 2  
    
     6 ENSG00000221312 0 1 2 3 2
    
    现在,我只想过滤部分列:
    
    我们就只能用
    
    final[complete.cases(final[,5:6]),]
    
    结果是:
    


       gene hsap mmul mmus rnor cfam  
    
     2 ENSG00000199674 0 2 2 2 2  
    
     4 ENSG00000207604 0 NA NA 1 2  
    
     6 ENSG00000221312 0 1 2 3 2
    
    这样第四行含有空值,但是,我们的命令是只过滤第5列,第6列中含有NA的行
    
  • 相关阅读:
    linux
    ansible
    语法糖
    jupyter login
    hadoop patch
    ganglia
    unixbench安装使用
    linux使用FIO测试磁盘的iops
    cpu事实负载使用top命令
    phoronix-test-suite测试云服务器
  • 原文地址:https://www.cnblogs.com/Raymontian/p/8607107.html
Copyright © 2011-2022 走看看