分类 - Code

我在Java中有一个双精度，我想检查它是否是NaN。最好的方法是什么?

我有一个数据框架，有~300K行和~40列。我想知道是否有任何行包含空值-并将这些“空”行放入一个单独的数据框架，以便我可以轻松地探索它们。

我可以显式地创建一个蒙版:

mask = False
for col in df.columns: 
    mask = mask | df[col].isnull()
dfnulls = df[mask]

或者我可以这样做:

df.ix[df.index[(df.T == np.nan).sum() > 1]]

是否有一种更优雅的方法(定位包含空值的行)?

如何从NumPy数组中删除NaN值?

[1, 2, NaN, 4, NaN, 8]   ⟶   [1, 2, 4, 8]

我将数据从.csv文件读取到Pandas数据框架，如下所示。对于其中一列，即id，我想将列类型指定为int。问题是id系列有缺失/空值。

当我试图在读取.csv时将id列强制转换为整数时，我得到:

df= pd.read_csv("data.csv", dtype={'id': int}) 
error: Integer column has NA values

或者，我尝试转换列类型后，阅读如下，但这一次我得到:

df= pd.read_csv("data.csv") 
df[['id']] = df[['id']].astype(int)
error: Cannot convert NA to integer

我该如何解决这个问题?

为什么NaN值的比较与所有其他值的比较行为不同? 也就是说，与运算符==，<=，>=，<，>的所有比较，其中一个或两个值都是NaN，返回false，与所有其他值的行为相反。

我认为这在某种程度上简化了数值计算，但我找不到一个明确的原因，甚至在Kahan的《IEEE 754状态讲义》中也找不到，他详细讨论了其他设计决策。

在进行简单的数据处理时，这种异常行为会造成麻烦。例如，当在C程序中对记录列表w.r.t.某个实值字段进行排序时，我需要编写额外的代码来处理NaN作为最大元素，否则排序算法可能会变得混乱。

编辑: 到目前为止，所有的答案都认为比较nan是没有意义的。

我同意，但这并不意味着正确答案是错误的，而是一个非布尔型(NaB)，幸运的是它并不存在。

所以在我看来，选择返回真或假进行比较是随意的，对于一般的数据处理来说，如果它符合通常的规律，那将是有利的 (==的反身性，<，==，>的三分)，以免依赖这些定律的数据结构变得混乱。

所以我要求的是打破这些定律的一些具体好处，而不仅仅是哲学推理。

编辑2: 我想我现在明白为什么让NaN最大是一个坏主意了，它会搞砸上限的计算。

NaN != NaN可能是可取的，以避免检测循环中的收敛，例如

while (x != oldX) {
    oldX = x;
    x = better_approximation(x);
}

但是最好是通过比较小极限下的绝对差来写。所以恕我直言，这是一个相对较弱的论点，打破自反性在NaN。

在JavaScript中解析值时，是否可能以某种方式返回0而不是NaN ?

如果是空字符串，parseInt返回NaN。

是否有可能在JavaScript中做这样的事情来检查NaN?

var value = parseInt(tbb) == NaN ? 0 : parseInt(tbb)

或者可能有另一个函数或jQuery插件可以做类似的事情?

我有一个熊猫数据框架如下所示:

    1    2       3
 0  a  NaN    read
 1  b    l  unread
 2  c  NaN    read

我想用空字符串删除NaN值，使其看起来像这样:

    1    2       3
 0  a   ""    read
 1  b    l  unread
 2  c   ""    read

是否存在isnan()函数?

注:我在MinGW(如果这有区别的话)。

我使用isnan()从<math.h>解决了这个问题，这在<cmath>中不存在，我一开始是#包括在内的。

我只在Firefox的JavaScript控制台中尝试过，但以下语句都没有返回true:

parseFloat('geoff') == NaN;

parseFloat('geoff') == Number.NaN;

我有一个熊猫数据框架如下:

      itm Date                  Amount 
67    420 2012-09-30 00:00:00   65211
68    421 2012-09-09 00:00:00   29424
69    421 2012-09-16 00:00:00   29877
70    421 2012-09-23 00:00:00   30990
71    421 2012-09-30 00:00:00   61303
72    485 2012-09-09 00:00:00   71781
73    485 2012-09-16 00:00:00     NaN
74    485 2012-09-23 00:00:00   11072
75    485 2012-09-30 00:00:00  113702
76    489 2012-09-09 00:00:00   64731
77    489 2012-09-16 00:00:00     NaN

当我尝试应用一个函数到金额列，我得到以下错误:

ValueError: cannot convert float NaN to integer

我尝试使用数学模块中的.isnan应用一个函数我已经尝试了pandas .replace属性我尝试了pandas 0.9中的.sparse data属性我还尝试了在函数中if NaN == NaN语句。我也看了这篇文章我如何替换NA值与零在一个R数据框架?同时看一些其他的文章。我尝试过的所有方法都不起作用或不能识别NaN。任何提示或解决方案将不胜感激。

你如何检验一个double是否等于NaN?

如何从一个熊猫DataFrame选择一个或多个空行而不显式列出列?

如何从NumPy数组中删除NaN值?

将包含nan的Pandas列转换为dtype ' int '

IEEE754 NaN值所有比较返回false的基本原理是什么?

如何将NaN从parseInt变成0为一个空字符串?

将NaN替换为空字符串

在c++中检查double(或float)是否为NaN

如何在JavaScript中检查一个数字是NaN ?

如何在熊猫数据框架的一列中用零替换NaN值?

标签

最新文章