如何删除文件中的特定行?

假设我有一个充满昵称的文本文件。如何使用Python从这个文件中删除特定的昵称?

当前回答

也许你已经有了正确答案，但下面是我的答案。我没有使用列表来收集未经过滤的数据(readlines()方法所做的)，而是使用了两个文件。一个用于保存主数据，第二个用于在删除特定字符串时过滤数据。这是一个代码:

main_file = open('data_base.txt').read()    # your main dataBase file
filter_file = open('filter_base.txt', 'w')
filter_file.write(main_file)
filter_file.close()
main_file = open('data_base.txt', 'w')
for line in open('filter_base'):
    if 'your data to delete' not in line:    # remove a specific string
        main_file.write(line)                # put all strings back to your db except deleted
    else: pass
main_file.close()

希望你会发现这有用!：）

2015-11-25 07:16:25

其他回答

在我看来，最好和最快的选择是在其他地方重写文件，而不是将所有内容存储在一个列表中并重新打开文件来写入。

with open("yourfile.txt", "r") as file_input:
    with open("newfile.txt", "w") as output: 
        for line in file_input:
            if line.strip("\n") != "nickname_to_delete":
                output.write(line)

就是这样!在一个且只有一个循环中，你可以做同样的事情。这样会快得多。

2014-11-13 15:28:29

这是来自@Lother的答案的一个“分叉”(我相信这应该被认为是正确的答案)。

对于这样的文件:

$ cat file.txt 
1: october rust
2: november rain
3: december snow

Lother解决方案中的这个分支工作得很好:

#!/usr/bin/python3.4

with open("file.txt","r+") as f:
    new_f = f.readlines()
    f.seek(0)
    for line in new_f:
        if "snow" not in line:
            f.write(line)
    f.truncate()

改进:

使用open，丢弃了f.s close()的用法更清晰的if/else用于计算当前行中是否存在字符串

2017-07-25 05:46:09

您可以使用re库

假设您能够加载完整的txt文件。然后定义一个不需要的昵称列表，然后用空字符串“”替换它们。

# Delete unwanted characters
import re

# Read, then decode for py2 compat.
path_to_file = 'data/nicknames.txt'
text = open(path_to_file, 'rb').read().decode(encoding='utf-8')

# Define unwanted nicknames and substitute them
unwanted_nickname_list = ['SourDough']
text = re.sub("|".join(unwanted_nickname_list), "", text)

2019-08-08 16:01:22

在第一次传递中读取行并在第二次传递中进行更改(删除特定行)的问题是，如果文件大小很大，则会耗尽RAM。相反，更好的方法是逐行读取，并将它们写入单独的文件，删除不需要的文件。我曾经在12- 50gb大的文件上运行过这种方法，RAM使用几乎保持不变。只有CPU周期显示正在进行的处理。

2013-11-06 22:03:37

一般来说，你不能;您必须重新编写整个文件(至少从更改点到末尾)。

在某些特定的情况下，你可以做得比这个更好

如果所有的数据元素都是相同的长度，并且没有特定的顺序，并且您知道要删除的数据元素的偏移量，那么您可以将最后一项复制到要删除的数据元素之上，并在最后一项之前截断文件;

或者你可以用“这是坏数据，跳过它”的值覆盖数据块，或者在保存的数据元素中保留“此项已删除”的标记，这样你就可以在不修改文件的情况下标记它已删除。

对于短文档(小于100 KB的文档?)来说，这可能有点过分了。

2011-01-17 05:55:48

如何删除文件中的特定行?

推荐文章

最新文章

标签