如何在NumPy数组中获得N个最大值的索引?

NumPy提出了一种通过np.argmax获取数组最大值索引的方法。

我想要一个类似的东西，但返回N个最大值的索引。

例如，如果我有一个数组[1,3,2,4,5]，那么nargmax(array, n=3)将返回对应于元素[5,4,3]的下标[4,3,1]。

当前回答

下面是查看最大元素及其位置的一个非常简单的方法。这里轴是定义域;对于2D情况，axis = 0表示列的最大数量，axis = 1表示行的最大数量。对于高维，这取决于你。

M = np.random.random((3, 4))
print(M)
print(M.max(axis=1), M.argmax(axis=1))

2018-06-16 08:20:27

其他回答

如果你正在处理nan和/或理解np有问题。试试pandas.DataFrame.sort_values。

import numpy as np
import pandas as pd    

a = np.array([9, 4, 4, 3, 3, 9, 0, 4, 6, 0])

df = pd.DataFrame(a, columns=['array'])
max_values = df['array'].sort_values(ascending=False, na_position='last')
ind = max_values[0:3].index.to_list()

这个例子给出了3个最大的非nan值的索引。可能效率很低，但易于阅读和定制。

2022-11-09 16:26:03

我能想到的最简单的是:

>>> import numpy as np
>>> arr = np.array([1, 3, 2, 4, 5])
>>> arr.argsort()[-3:][::-1]
array([4, 3, 1])

这涉及到一个完整的数组。我想知道numpy是否提供了一种内置的方法来进行部分排序;到目前为止我还没有找到。

如果这个解决方案太慢(特别是对于小n)，那么可能值得考虑用Cython编写一些东西。

2011-08-02 10:32:53

我认为最省时的方法是手动遍历数组并保持k-size的min-heap，正如其他人所提到的那样。

我还想出了一个蛮力方法:

top_k_index_list = [ ]
for i in range(k):
    top_k_index_list.append(np.argmax(my_array))
    my_array[top_k_index_list[-1]] = -float('inf')

在使用argmax获取其索引后，将最大的元素设置为一个较大的负值。然后argmax的下一次调用将返回第二大的元素。您可以记录这些元素的原始值，并在需要时恢复它们。

2018-04-25 10:09:07

M = np.random.random((3, 4))
print(M)
print(M.max(axis=1), M.argmax(axis=1))

2018-06-16 08:20:27

这将比完整排序更快，这取决于原始数组的大小和选择的大小:

>>> A = np.random.randint(0,10,10)
>>> A
array([5, 1, 5, 5, 2, 3, 2, 4, 1, 0])
>>> B = np.zeros(3, int)
>>> for i in xrange(3):
...     idx = np.argmax(A)
...     B[i]=idx; A[idx]=0 #something smaller than A.min()
...     
>>> B
array([0, 2, 3])

当然，这涉及到对原始数组的篡改。你可以修复(如果需要)通过复制或替换回原始值. ...对你的用例来说，哪个更便宜。

2011-08-02 13:54:12

如何在NumPy数组中获得N个最大值的索引?

推荐文章

最新文章

标签