列表推导式vs. lambda +过滤器

我有一个列表，我想通过项目的属性进行筛选。

以下哪个是首选(可读性，性能，其他原因)?

xs = [x for x in xs if x.attribute == value]

xs = filter(lambda x: x.attribute == value, xs)

当前回答

当我需要在列表理解之后过滤一些东西时，我使用了一小段。只是过滤器、lambda和列表的组合(或者称为猫的忠诚度和狗的清洁度)。

在这种情况下，我正在读取一个文件，剥离空行，注释掉行，以及在一行的注释之后的任何内容:

# Throw out blank lines and comments
with open('file.txt', 'r') as lines:        
    # From the inside out:
    #    [s.partition('#')[0].strip() for s in lines]... Throws out comments
    #   filter(lambda x: x!= '', [s.part... Filters out blank lines
    #  y for y in filter... Converts filter object to list
    file_contents = [y for y in filter(lambda x: x != '', [s.partition('#')[0].strip() for s in lines])]

2015-08-28 19:31:41

其他回答

我会得出结论:使用列表理解而不是过滤器，因为它

更具可读性更多的神谕的更快(对于Python 3.11，参见附带的基准测试，也参见)

请记住，filter返回一个迭代器，而不是一个列表。

python3 -m timeit '[x for x in range(10000000) if x % 2 == 0]'

1个循环，5个最佳:每循环270毫秒

python3 -m timeit 'list(filter(lambda x: x % 2 == 0, range(10000000)))'

1个循环，最好的5:432毫秒每循环

2022-11-14 13:04:23

奇怪的是，不同的人的美相差如此之大。我发现列表理解比filter+lambda清晰得多，但使用您认为更容易的。

有两件事可能会减慢你使用滤镜的速度。

首先是函数调用开销:一旦使用Python函数(无论是由def还是lambda创建的)，过滤器很可能会比列表理解慢。几乎可以肯定，这并不重要，在对代码进行计时并发现它是一个瓶颈之前，您不应该过多地考虑性能，但区别是存在的。

可能应用的另一个开销是lambda被强制访问一个有作用域的变量(值)。这比在python2中访问局部变量要慢。X，列表推导式只访问局部变量。如果你使用的是Python 3。X，列表综合在一个单独的函数中运行，因此它也将通过闭包访问值，这种差异将不适用。

另一个可以考虑的选项是使用生成器而不是列表推导式:

def filterbyvalue(seq, value):
   for el in seq:
       if el.attribute==value: yield el

然后在你的主代码中(这是可读性真正重要的地方)，你用一个有意义的函数名替换了列表理解和过滤器。

2010-06-10 10:52:49

尽管过滤器可能是“更快的方式”，但“Python方式”是不关心这些事情，除非性能绝对关键(在这种情况下，您不会使用Python!)。

2010-06-10 10:22:36

你的问题既简单又有趣。它只是显示了python作为一种编程语言是多么的灵活。人们可以使用任何逻辑，根据自己的才能和理解来编写程序。只要我们得到答案就好。

在您的情况下，这只是一个简单的过滤方法，可以由两者完成，但我更喜欢第一个my_list = [x for x in my_list if x.attribute == value]，因为它看起来简单，不需要任何特殊的语法。任何人都可以理解这个命令，并在需要时进行更改。 (虽然第二种方法也很简单，但对于初级程序员来说，它仍然比第一种方法更复杂)

2022-03-11 06:22:46

我想我只是在python 3中添加，filter()实际上是一个迭代器对象，所以你必须将你的filter方法调用传递给list()，以构建过滤后的列表。所以在python 2中:

lst_a = range(25) #arbitrary list
lst_b = [num for num in lst_a if num % 2 == 0]
lst_c = filter(lambda num: num % 2 == 0, lst_a)

列表b和c具有相同的值，并且在filter()等效的时间内完成[x for x in y if z]。然而，在3中，相同的代码将使列表c包含一个筛选器对象，而不是一个筛选过的列表。要在3中产生相同的值:

lst_a = range(25) #arbitrary list
lst_b = [num for num in lst_a if num % 2 == 0]
lst_c = list(filter(lambda num: num %2 == 0, lst_a))

问题是list()接受一个可迭代对象作为参数，并从该参数创建一个新列表。结果是，在python 3中以这种方式使用filter所花费的时间是[x for x in y if z]方法的两倍，因为你必须遍历filter()的输出以及原始列表。

2016-09-06 06:26:35

列表推导式vs. lambda +过滤器

推荐文章

最新文章

标签