1、查看缺失值
> x <- c(3,1,NA,NA)
> x <- c(3,1,NA,NA)
> y <- c(3,4,2,7)
> z <- c(3,2,5,1)
> da <- data.frame(x,y,z)
> da
x y z
1 3 3 3
2 1 4 2
3 NA 2 5
4 NA 7 1
> is.na(da)
x y z
[1,] FALSE FALSE FALSE
[2,] FALSE FALSE FALSE
[3,] TRUE FALSE FALSE
[4,] TRUE FALSE FALSE
> is.na(da[,1:2])
x y
[1,] FALSE FALSE
[2,] FALSE FALSE
[3,] TRUE FALSE
[4,] TRUE FALSE
2、缺失值重新赋值
> da
x y z
1 3 3 3
2 1 4 2
3 NA 2 5
4 NA 7 1
> da$x[is.na(da[,1])]
[1] NA NA
> da$x[is.na(da[,1])][1] <- 10
> da
x y z
1 3 3 3
2 1 4 2
3 10 2 5
4 NA 7 1
3、排除缺失值
da
sum(da$x)
sum(da$x,na.rm = T)
mean(da$x)
mean(da$x,na.rm = T)
4、删除含有缺失值的行
da
a <- na.omit(da)
a