确定每列中NA值的个数

我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df，我正在考虑的列的名称是col。我提出的方法如下:

sapply(df$col, function(x) sum(length(which(is.na(x)))))

这是一个好的/最有效的方法吗?

当前回答

获得所有列NA计数的一个快速简单的Tidyverse解决方案是使用summarise_all()，我认为这比使用purrr或sapply更容易读取解决方案

library(tidyverse)
# Example data
df <- tibble(col1 = c(1, 2, 3, NA), 
             col2 = c(NA, NA, "a", "b"))

df %>% summarise_all(~ sum(is.na(.)))
#> # A tibble: 1 x 2
#>    col1  col2
#>   <int> <int>
#> 1     1     2

或者使用更现代的across()函数:

df %>% summarise(across(everything(), ~ sum(is.na(.))))

2019-10-31 10:58:15

其他回答

如果你在每一列中寻找空值，然后一个接一个地打印，那么你可以使用这个。简单的解决方案。

lapply(df, function(x) { length(which(is.na(x)))})

2021-03-20 09:05:44

试试这个:

length(df$col[is.na(df$col)])

2016-03-25 20:09:18

你想太多了:

sum(is.na(df$col))

2014-06-04 01:31:04

类似于hute37的答案，但使用了purrr包。我认为这种tidyverse方法比AbiK提出的答案更简单。

library(purrr)
map_dbl(df, ~sum(is.na(.)))

注意:波浪号(~)创建一个匿名函数。还有'。’指的是匿名函数的输入，在本例中为data.frame df。

2018-07-29 17:31:48

你可以用它来计算每一列中NA或空格的数量

colSums(is.na(data_set_name)|data_set_name == '')

2017-12-07 19:39:24

确定每列中NA值的个数

推荐文章

最新文章

标签