如何克隆列表，使其在分配后不会意外更改？

使用new_list=my_list时，对new_list的任何修改都会每次更改my_list。为什么会出现这种情况，以及如何克隆或复制列表以防止出现这种情况？

当前回答

这是因为，行new_list=my_list为变量my_list分配了一个新的引用，即new_list这类似于下面给出的C代码，

int my_list[] = [1,2,3,4];
int *new_list;
new_list = my_list;

您应该使用复制模块创建新列表

import copy
new_list = copy.deepcopy(my_list)

2020-06-04 10:40:28

其他回答

使用对象[：]

>>> a = [1,2]
>>> b = a[:]
>>> a += [3]
>>> a
[1, 2, 3]
>>> b
[1, 2]
>>>

2010-04-10 08:53:06

让我惊讶的是，这还没有被提及，所以为了完整起见。。。

您可以使用“splat operator”：*执行列表解包，这也将复制列表的元素。

old_list = [1, 2, 3]

new_list = [*old_list]

new_list.append(4)
old_list == [1, 2, 3]
new_list == [1, 2, 3, 4]

这种方法的明显缺点是它仅在Python 3.5+中可用。

尽管从时间上看，这似乎比其他常用方法表现得更好。

x = [random.random() for _ in range(1000)]

%timeit a = list(x)
%timeit a = x.copy()
%timeit a = x[:]

%timeit a = [*x]

#: 2.47 µs ± 38.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
#: 2.47 µs ± 54.6 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
#: 2.39 µs ± 58.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

#: 2.22 µs ± 43.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

2018-02-26 02:33:47

菲利克斯已经给出了一个很好的答案，但我想我应该对各种方法进行速度比较：

10.59秒（105.9µs/itn）-copy.depcopy（旧列表）10.16秒（101.6µs/itn）-纯Python Copy（）方法使用deepcopy复制类1.488秒（14.88µs/itn）-纯Python Copy（）方法不复制类（仅dicts/lists/tuples）0.325秒（3.25µs/itn）-对于old_list:new_list.append（项目）中的项目0.217秒（2.17µs/itn）-[i代表old_list]（列表理解）0.186秒（1.86µs/itn）-复制副本（old_list）0.075秒（0.75µs/itn）-列表（旧列表）0.053秒（0.53µs/itn）-新列表=[]；新列表扩展（旧列表）0.039秒（0.39µs/itn）-old_list[：]（列表切片）

所以最快的是列表切片。但请注意，与copy.deepcopy（）和python版本不同，copy.copy（）、list[：]和list（list）不会复制列表中的任何列表、字典和类实例，因此如果原始列表发生变化，它们也会在复制的列表中发生变化，反之亦然。

（如果有人感兴趣或想提出任何问题，以下是脚本：）

from copy import deepcopy

class old_class:
    def __init__(self):
        self.blah = 'blah'

class new_class(object):
    def __init__(self):
        self.blah = 'blah'

dignore = {str: None, unicode: None, int: None, type(None): None}

def Copy(obj, use_deepcopy=True):
    t = type(obj)

    if t in (list, tuple):
        if t == tuple:
            # Convert to a list if a tuple to
            # allow assigning to when copying
            is_tuple = True
            obj = list(obj)
        else:
            # Otherwise just do a quick slice copy
            obj = obj[:]
            is_tuple = False

        # Copy each item recursively
        for x in xrange(len(obj)):
            if type(obj[x]) in dignore:
                continue
            obj[x] = Copy(obj[x], use_deepcopy)

        if is_tuple:
            # Convert back into a tuple again
            obj = tuple(obj)

    elif t == dict:
        # Use the fast shallow dict copy() method and copy any
        # values which aren't immutable (like lists, dicts etc)
        obj = obj.copy()
        for k in obj:
            if type(obj[k]) in dignore:
                continue
            obj[k] = Copy(obj[k], use_deepcopy)

    elif t in dignore:
        # Numeric or string/unicode?
        # It's immutable, so ignore it!
        pass

    elif use_deepcopy:
        obj = deepcopy(obj)
    return obj

if __name__ == '__main__':
    import copy
    from time import time

    num_times = 100000
    L = [None, 'blah', 1, 543.4532,
         ['foo'], ('bar',), {'blah': 'blah'},
         old_class(), new_class()]

    t = time()
    for i in xrange(num_times):
        Copy(L)
    print 'Custom Copy:', time()-t

    t = time()
    for i in xrange(num_times):
        Copy(L, use_deepcopy=False)
    print 'Custom Copy Only Copying Lists/Tuples/Dicts (no classes):', time()-t

    t = time()
    for i in xrange(num_times):
        copy.copy(L)
    print 'copy.copy:', time()-t

    t = time()
    for i in xrange(num_times):
        copy.deepcopy(L)
    print 'copy.deepcopy:', time()-t

    t = time()
    for i in xrange(num_times):
        L[:]
    print 'list slicing [:]:', time()-t

    t = time()
    for i in xrange(num_times):
        list(L)
    print 'list(L):', time()-t

    t = time()
    for i in xrange(num_times):
        [i for i in L]
    print 'list expression(L):', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(L)
    print 'list extend:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        for y in L:
            a.append(y)
    print 'list append:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(i for i in L)
    print 'generator expression extend:', time()-t

2010-04-10 10:16:24

让我们从头开始，探讨这个问题。

假设您有两个列表：

list_1 = ['01', '98']
list_2 = [['01', '98']]

我们必须复制两个列表，现在从第一个列表开始：

因此，首先让我们将变量副本设置为原始列表list_1：

copy = list_1

现在，如果你认为copy复制了list_1，那么你错了。id函数可以告诉我们两个变量是否可以指向同一个对象。让我们试试看：

print(id(copy))
print(id(list_1))

输出为：

4329485320
4329485320

这两个变量是完全相同的参数。你惊讶吗？

所以我们知道，Python不会在变量中存储任何内容，变量只是引用对象，对象存储值。这里的对象是一个列表，但我们通过两个不同的变量名创建了对同一对象的两个引用。这意味着两个变量都指向同一个对象，只是名称不同。

当您执行copy=list_1时，它实际上正在执行以下操作：

在这里，图像list_1和copy是两个变量名，但两个变量的对象是相同的，即列表。

因此，如果您尝试修改复制的列表，那么它也会修改原始列表，因为那里只有一个列表，无论您是从复制的列表还是从原始列表进行修改，都会修改该列表：

copy[0] = "modify"

print(copy)
print(list_1)

输出：

['modify', '98']
['modify', '98']

所以它修改了原始列表：

现在，让我们来看看复制列表的Pythonic方法。

copy_1 = list_1[:]

该方法解决了我们遇到的第一个问题：

print(id(copy_1))
print(id(list_1))

4338792136
4338791432

因此，我们可以看到两个列表都有不同的id，这意味着两个变量都指向不同的对象。所以这里的实际情况是：

现在，让我们尝试修改列表，看看我们是否仍然面临前面的问题：

copy_1[0] = "modify"

print(list_1)
print(copy_1)

输出为：

['01', '98']
['modify', '98']

如您所见，它只修改了复制的列表。这意味着它奏效了。

你认为我们结束了吗？不，让我们尝试复制嵌套列表。

copy_2 = list_2[:]

list2应该引用另一个对象，该对象是list2的副本。让我们检查一下：

print(id((list_2)), id(copy_2))

我们得到输出：

4330403592 4330403528

现在我们可以假设两个列表都指向不同的对象，所以现在让我们尝试修改它，看看它给出了我们想要的：

copy_2[0][1] = "modify"

print(list_2, copy_2)

这为我们提供了输出：

[['01', 'modify']] [['01', 'modify']]

这可能看起来有点令人困惑，因为我们以前使用的相同方法奏效了。让我们试着理解这一点。

当您这样做时：

copy_2 = list_2[:]

你只是在复制外部列表，而不是内部列表。我们可以再次使用id函数来检查这一点。

print(id(copy_2[0]))
print(id(list_2[0]))

输出为：

4329485832
4329485832

当我们执行copy_2=list_2[：]时，会发生以下情况：

它创建列表副本，但仅创建外部列表副本，而不是嵌套列表副本。两个变量的嵌套列表都相同，因此如果您尝试修改嵌套列表，那么它也会修改原始列表，因为嵌套列表对象对于两个列表都相同。

解决方案是什么？解决方案是deepcopy函数。

from copy import deepcopy
deep = deepcopy(list_2)

让我们检查一下：

print(id((list_2)), id(deep))

4322146056 4322148040

两个外部列表都有不同的ID。让我们在内部嵌套列表上尝试一下。

print(id(deep[0]))
print(id(list_2[0]))

输出为：

4322145992
4322145800

正如您所看到的，两个ID都不同，这意味着我们可以假设两个嵌套列表现在都指向不同的对象。

这意味着当您执行deep=deepcopy（list_2）时，实际发生了什么：

两个嵌套列表都指向不同的对象，现在它们有嵌套列表的单独副本。

现在，让我们尝试修改嵌套列表，看看它是否解决了前面的问题：

deep[0][1] = "modify"
print(list_2, deep)

它输出：

[['01', '98']] [['01', 'modify']]

如您所见，它没有修改原始嵌套列表，只修改了复制的列表。

2017-11-13 07:04:17

框架挑战：对于您的应用程序，您实际上需要复制吗？

我经常看到试图以某种迭代方式修改列表副本的代码。为了构造一个简单的示例，假设我们有非工作（因为不应该修改x）代码，如：

x = [8, 6, 7, 5, 3, 0, 9]
y = x
for index, element in enumerate(y):
    y[index] = element * 2
# Expected result:
# x = [8, 6, 7, 5, 3, 0, 9] <-- this is where the code is wrong.
# y = [16, 12, 14, 10, 6, 0, 18]

自然，人们会问如何使y成为x的副本，而不是同一列表的名称，这样for循环就会做正确的事情。

但这是错误的做法。从功能上讲，我们真正想做的是在原始列表的基础上创建一个新列表。

我们不需要先做一份拷贝，通常也不应该。

当我们需要对每个元素应用逻辑时

这方面的自然工具是列表理解。这样，我们编写逻辑，告诉我们期望结果中的元素如何与原始元素相关联。它简单、优雅、富有表现力；并且我们避免了在for循环中修改y副本的需要（因为分配给迭代变量不会影响列表-原因与我们首先想要副本的原因相同！）。

对于上面的示例，它看起来像：

x = [8, 6, 7, 5, 3, 0, 9]
y = [element * 2 for element in x]

列表理解非常强大；我们还可以使用它们通过带有if子句的规则过滤掉元素，并且我们可以链接for和if子句（它的工作方式与相应的命令式代码类似，相同的子句的顺序相同；只有最终将在结果列表中结束的值才会移到前面，而不是在“最里面”部分）。如果计划是在修改副本以避免问题的同时迭代原始文件，那么通常有一种更令人愉快的方法来实现这一点，即理解过滤列表。

当我们需要按位置拒绝或插入特定元素时

假设我们有这样的东西

x = [8, 6, 7, 5, 3, 0, 9]
y = x
del y[2:-2] # oops, x was changed inappropriately

我们可以通过将我们不需要的部分放在一起来建立一个列表，而不是先创建一个单独的副本来删除我们不想要的部分。因此：

x = [8, 6, 7, 5, 3, 0, 9]
y = x[:2] + x[-2:]

通过切片处理插入、替换等操作是一项练习。只需说明您希望结果包含哪些子序列。这种情况的一个特殊情况是制作一个反向副本-假设我们需要一个新列表（而不仅仅是反向迭代），我们可以通过切片直接创建它，而不是克隆然后使用.reverse。

这些方法（如列表理解）还有一个优点，即它们将所需的结果创建为表达式，而不是通过程序性地就地修改现有对象（并返回None）。这对于以“流畅”风格编写代码更为方便。

2022-09-23 17:19:15

如何克隆列表，使其在分配后不会意外更改？

推荐文章

最新文章

标签