是否有NumPy函数返回数组中某物的第一个索引?

我知道Python列表有一个方法可以返回某个对象的第一个索引:

>>> xs = [1, 2, 3]
>>> xs.index(2)
1

NumPy数组也有类似的东西吗?

当前回答

L.index (x)返回最小的I，使得I是x在列表中第一次出现的索引。

可以放心地假设，Python中的index()函数的实现使它在找到第一个匹配后停止，这将导致最佳的平均性能。

要在NumPy数组中找到第一个匹配后停止的元素，请使用迭代器(ndenumerate)。

In [67]: l=range(100)

In [68]: l.index(2)
Out[68]: 2

NumPy数组:

In [69]: a = np.arange(100)

In [70]: next((idx for idx, val in np.ndenumerate(a) if val==2))
Out[70]: (2L,)

注意，如果没有找到元素，index()和next方法都会返回一个错误。使用next，可以使用第二个参数在未找到元素时返回一个特殊值，例如:

In [77]: next((idx for idx, val in np.ndenumerate(a) if val==400),None)

NumPy中还有其他函数(argmax, where和nonzero)可用于在数组中查找元素，但它们都有一个缺点，即遍历整个数组查找所有出现的元素，因此无法优化以查找第一个元素。还要注意，where和非零返回数组，因此需要选择第一个元素来获取索引。

In [71]: np.argmax(a==2)
Out[71]: 2

In [72]: np.where(a==2)
Out[72]: (array([2], dtype=int64),)

In [73]: np.nonzero(a==2)
Out[73]: (array([2], dtype=int64),)

时间比较

只是检查对于大型数组，当搜索项位于数组的开头时，使用迭代器的解决方案更快(在IPython shell中使用%timeit):

In [285]: a = np.arange(100000)

In [286]: %timeit next((idx for idx, val in np.ndenumerate(a) if val==0))
100000 loops, best of 3: 17.6 µs per loop

In [287]: %timeit np.argmax(a==0)
1000 loops, best of 3: 254 µs per loop

In [288]: %timeit np.where(a==0)[0][0]
1000 loops, best of 3: 314 µs per loop

这是一个开放的NumPy GitHub问题。

参见:Numpy:快速找到第一个值索引

2017-05-06 14:12:30

其他回答

index_lst_form_numpy = pd.DataFrame(df).reset_index()["index"].tolist()

2022-07-14 12:28:50

是的，给定一个数组，数组和一个值，要搜索的项，你可以使用np。的地方:

itemindex = numpy.where(array == item)

结果是一个元组，首先是所有的行索引，然后是所有的列索引。

例如，如果一个数组是二维的，它包含你的项目在两个位置，那么

array[itemindex[0][0]][itemindex[1][0]]

将等于你的项目，因此将是:

array[itemindex[0][1]][itemindex[1][1]]

2009-01-11 03:12:03

您还可以将NumPy数组转换为list in - air并获取其索引。例如,

l = [1,2,3,4,5] # Python list
a = numpy.array(l) # NumPy array
i = a.tolist().index(2) # i will return index of 2
print i

它会输出1。

2014-06-02 12:47:58

如果你想用它作为其他东西的索引，如果数组是可广播的，你可以使用布尔索引;不需要显式索引。要做到这一点，绝对最简单的方法是基于真值进行索引。

other_array[first_array == item]

任何布尔运算都可以:

a = numpy.arange(100)
other_array[first_array > 50]

非零方法也接受布尔值:

index = numpy.nonzero(first_array == item)[0][0]

两个0分别表示索引元组(假设first_array是1D)和索引数组中的第一项。

2009-01-11 03:52:49

从np.where()中选择第一个元素的替代方法是使用生成器表达式和enumerate，例如:

>>> import numpy as np
>>> x = np.arange(100)   # x = array([0, 1, 2, 3, ... 99])
>>> next(i for i, x_i in enumerate(x) if x_i == 2)
2

对于二维数组，可以这样做:

>>> x = np.arange(100).reshape(10,10)   # x = array([[0, 1, 2,... 9], [10,..19],])
>>> next((i,j) for i, x_i in enumerate(x) 
...            for j, x_ij in enumerate(x_i) if x_ij == 2)
(0, 2)

这种方法的优点是，它在找到第一个匹配后停止检查数组的元素，而np。Where检查所有元素是否匹配。如果在数组的前面有匹配，生成器表达式会更快。

2016-11-04 15:17:58

是否有NumPy函数返回数组中某物的第一个索引?

推荐文章

最新文章

标签