我如何划分(分裂，划分)一个基于条件的列表?

我有这样的代码:

good = [x for x in mylist if x in goodvals]
bad = [x for x in mylist if x not in goodvals]

目标是根据mylist的内容是否满足条件，将它们拆分为另外两个列表。

我怎样才能做得更优雅呢?我能避免在mylist上做两个单独的迭代吗?我可以通过这样做来提高性能吗?

当前回答

如果你想用FP风格:

good, bad = [ sum(x, []) for x in zip(*(([y], []) if y in goodvals else ([], [y])
                                        for y in mylist)) ]

不是最易读的解决方案，但至少只遍历mylist一次。

2010-05-10 00:28:43

其他回答

第一步(pre-OP-edit):使用集合:

mylist = [1,2,3,4,5,6,7]
goodvals = [1,3,7,8,9]

myset = set(mylist)
goodset = set(goodvals)

print list(myset.intersection(goodset))  # [1, 3, 7]
print list(myset.difference(goodset))    # [2, 4, 5, 6]

这对可读性(IMHO)和性能都有好处。

第二步(post-OP-edit):

创建一个好的扩展列表:

IMAGE_TYPES = set(['.jpg','.jpeg','.gif','.bmp','.png'])

这将提高性能。否则，你现在的情况在我看来还不错。

2009-06-04 07:41:20

就我个人而言，我喜欢你引用的版本，假设你已经有了一个好的列表。如果没有，就像这样:

good = filter(lambda x: is_good(x), mylist)
bad = filter(lambda x: not is_good(x), mylist)

当然，这真的非常类似于使用列表理解，就像你最初做的，但用一个函数而不是一个查找:

good = [x for x in mylist if is_good(x)]
bad  = [x for x in mylist if not is_good(x)]

总的来说，我发现列表推导式的美学非常令人满意。当然，如果您实际上不需要保留顺序，也不需要重复，那么在集合上使用交集和差分方法也会很好。

2009-06-04 07:45:43

bad = []
good = [x for x in mylist if x in goodvals or bad.append(x)]

append返回None，所以它可以工作。

2019-09-17 14:18:40

我将采用2步方法，将谓词的求值与列表的过滤分离:

def partition(pred, iterable):
    xs = list(zip(map(pred, iterable), iterable))
    return [x[1] for x in xs if x[0]], [x[1] for x in xs if not x[0]]

就性能而言(除了在iterable的每个成员上只对pred求值一次之外)，这样做的好处在于它将大量逻辑从解释器中移出，转移到高度优化的迭代和映射代码中。这可以加快长迭代对象的迭代速度，就像回答中描述的那样。

在表达性方面，它利用了像理解和映射这样的表达性习语。

2014-12-17 02:00:27

如果你想用FP风格:

good, bad = [ sum(x, []) for x in zip(*(([y], []) if y in goodvals else ([], [y])
                                        for y in mylist)) ]

不是最易读的解决方案，但至少只遍历mylist一次。

2010-05-10 00:28:43

我如何划分(分裂，划分)一个基于条件的列表?

推荐文章

最新文章

标签