从匹配条件的可迭代对象中获取第一项

我想从匹配条件的列表中获得第一项。产生的方法不能处理整个列表，这一点很重要，因为列表可能相当大。例如，以下函数就足够了:

def first(the_iterable, condition = lambda x: True):
    for i in the_iterable:
        if condition(i):
            return i

这个函数可以这样使用:

>>> first(range(10))
0
>>> first(range(10), lambda i: i > 3)
4

但是，我想不出一个好的内置/单行程序来让我这样做。如果没有必要，我不想复制这个函数。是否有一种内置的方法来获取匹配条件的第一项?

当前回答

下面是带有基准的3个备选方案。

使用next ()

一行程序:

values = list(range(1, 10000000))

value = next((x for x in values if x > 9999999), None)

使用函数

这是使用函数next()的替代方案，它大约快2%-5%:

values = list(range(1, 10000000))

def first(items):
    for item in items:
        if item > 9999999:  # Your condition
            return item
    return None  # Default value

value = first(values)

使用λ

这是一个在所有情况下都可用于替换next()的函数。性能大约降低300%:

values = list(range(1, 10000000))

def first(items, condition, default = None):
    for item in items:
        if condition(item):
            return item
    return default

value = first(values, lambda x: x > 9999999, None)

基准

功能:1 x 下:1.02 - 1.05 x Lambda: > 3x

内存消耗相同。

这就是基准。

2022-12-01 14:40:43

其他回答

对于任何使用Python 3.8或更新版本的人，我建议使用PEP 572—赋值表达式中描述的“赋值表达式”。

if any((match := i) > 3 for i in range(10)):
    print(match)

2021-02-26 20:03:25

我会这样写

next(x for x in xrange(10) if x > 3)

2010-03-02 08:22:08

下面是三种方法的速度测试。Next()不是最快的方法。

from timeit import default_timer as timer

# Is set irreflexive?

def a():
    return frozenset((x3, x3) for x3 in set([x1[x2] for x2 in range(2) for x1 in value]) if (x3, x3) in value) == frozenset()


def b():
    return next((False for x1 in value if (x1[0], x1[0]) in value or (x1[1], x1[1]) in value), True)


def c():
    for x1 in value:
        if (x1[0], x1[0]) in value or (x1[1], x1[1]) in value:
            return False
    return True


times = 1000000
value = frozenset({(1, 3), (2, 1)})


start_time = timer()
for x in range(times):
    a()
print("a(): Calculation ended after " + str(round((timer() - start_time) * 1000) / 1000.0) + " sec")

start_time = timer()
for x in range(times):
    b()
print("b(): Calculation ended after " + str(round((timer() - start_time) * 1000) / 1000.0) + " sec")

start_time = timer()
for x in range(times):
    c()
print("c(): Calculation ended after " + str(round((timer() - start_time) * 1000) / 1000.0) + " sec")

结果:

Calculation ended after 1.365 sec
Calculation ended after 0.685 sec
Calculation ended after 0.493 sec

2021-12-01 15:55:13

这个问题已经有了很好的答案。我只是说说我的意见，因为我来这里是想为我自己的问题找到一个解决方案，这和OP非常相似。

如果你想使用生成器找到匹配条件的第一项的INDEX，你可以简单地这样做:

next(index for index, value in enumerate(iterable) if condition)

2017-05-10 15:25:55

Python 3中最有效的方法是以下方法之一(使用类似的示例):

“理解”风格:

next(i for i in range(100000000) if i == 1000)

警告:该表达式也适用于Python 2，但在本例中使用的range在Python 3中返回一个可迭代对象，而不是像Python 2那样返回一个列表(如果你想在Python 2中构造一个可迭代对象，则使用xrange代替)。

注意，表达式避免在理解表达式next([i for…])中构造一个列表，这将导致在筛选元素之前创建一个包含所有元素的列表，并将导致处理整个选项，而不是在i == 1000时停止迭代。

具有“功能性”风格:

next(filter(lambda i: i == 1000, range(100000000)))

警告:这在Python 2中不起作用，甚至用xrange替换range，因为过滤器创建了一个列表而不是迭代器(效率低)，下一个函数只适用于迭代器。

默认值

正如在其他响应中提到的那样，如果希望避免在条件不满足时引发异常，则必须向接下来的函数添加一个额外参数。

“功能性”风格:

next(filter(lambda i: i == 1000, range(100000000)), False)

“理解”风格:

使用这种风格，你需要用()包围理解表达式，以避免SyntaxError:如果不是唯一的参数，生成器表达式必须用圆括号括起来:

next((i for i in range(100000000) if i == 1000), False)

2018-01-08 17:30:14

从匹配条件的可迭代对象中获取第一项

推荐文章

最新文章

标签