如何从文件中读取特定的行(按行号)?

我使用for循环来读取文件，但我只想读取特定的行，比如第26行和第30行。是否有任何内置功能来实现这一点?

当前回答

简单的回答是:

f=open('filename')
lines=f.readlines()
print lines[25]
print lines[29]

or:

lines=[25, 29]
i=0
f=open('filename')
for line in f:
    if i in lines:
        print i
    i+=1

有一个更优雅的解决方案来提取许多行:linecache(由“python:如何跳转到一个巨大文本文件中的特定行?”提供，这是stackoverflow.com之前的一个问题)。

引用上面链接的python文档:

>>> import linecache
>>> linecache.getline('/etc/passwd', 4)
'sys:x:3:3:sys:/dev:/bin/sh\n'

将4更改为您想要的行号，然后就开始了。注意，4将带来第五行，因为计数是从零开始的。

如果文件非常大，并且在读入内存时会出现问题，那么接受@Alok的建议并使用enumerate()可能是个好主意。

结论:

使用fileobject.readlines()或fileobject中的for line作为小文件的快速解决方案。使用linecache作为一个更优雅的解决方案，它将非常快地读取许多文件，可能是重复的。采纳@Alok的建议，使用enumerate()来处理可能非常大的文件，并且不适合内存。注意，使用此方法可能会变慢，因为文件是按顺序读取的。

2010-01-17 17:18:47

其他回答

如果你不介意导入，那么fileinput确实是你需要的(这是你可以读取当前行的行号)

2010-01-17 17:21:58

您可以使用一种最简单的逻辑将字符串拆分为数组或List。

f = open('filepath')
r = f.read()
s = r.split("\n")
n = [linenumber1, linenumber2] # [26, 29] in your 
                               #case
for x in n:
  print(s[x-1])
f.close()

2022-04-08 04:15:49

读取文件非常快。读取一个100MB的文件需要不到0.1秒(请参阅我的文章用Python读写文件)。因此，你应该完整地阅读它，然后处理单行。

大多数回答这里做的不是错，而是风格不好。打开文件应该总是用with，因为它可以确保文件再次关闭。

所以你应该这样做:

with open("path/to/file.txt") as f:
    lines = f.readlines()
print(lines[26])  # or whatever you want to do with this line
print(lines[30])  # or whatever you want to do with this line

巨大的文件

如果你有一个巨大的文件，内存消耗是一个问题，你可以逐行处理它:

with open("path/to/file.txt") as f:
    for i, line in enumerate(f):
        pass  # process line i

2015-03-23 20:41:26

相当快，切中要害。

打印文本文件中的某些行。创建一个“lines2print”列表然后当枚举“在”lines2print列表中时，只需打印。要去除多余的'\n'，请使用line.strip()或line.strip('\n')。我只是喜欢“列表理解”，并尽可能地使用它。我喜欢用“with”方法来读取文本文件，以防止以任何理由打开文件。

lines2print = [26,30] # can be a big list and order doesn't matter.

with open("filepath", 'r') as fp:
    [print(x.strip()) for ei,x in enumerate(fp) if ei in lines2print]

或者如果list很小，只需在理解式中输入list作为列表。

with open("filepath", 'r') as fp:
    [print(x.strip()) for ei,x in enumerate(fp) if ei in [26,30]]

2018-12-14 17:56:29

为了完整起见，这里还有一个选项。

让我们从python文档中的定义开始:

通常包含序列的一部分的对象。slice使用下标符号[]创建，当给出几个数字时，数字之间使用冒号，例如variable_name[1:3:5]。括号(下标)表示法在内部使用切片对象(或在旧版本中使用__getslice__()和__setslice__())。

虽然slice表示法一般不直接适用于迭代器，但itertools包包含一个替换函数:

from itertools import islice

# print the 100th line
with open('the_file') as lines:
    for line in islice(lines, 99, 100):
        print line

# print each third line until 100
with open('the_file') as lines:
    for line in islice(lines, 0, 100, 3):
        print line

该函数的另一个优点是，它直到结束才读取迭代器。所以你可以做更复杂的事情:

with open('the_file') as lines:
    # print the first 100 lines
    for line in islice(lines, 100):
        print line

    # then skip the next 5
    for line in islice(lines, 5):
        pass

    # print the rest
    for line in lines:
        print line

为了回答最初的问题:

# how to read lines #26 and #30
In [365]: list(islice(xrange(1,100), 25, 30, 4))
Out[365]: [26, 30]

2014-11-24 15:49:56

如何从文件中读取特定的行(按行号)?

推荐文章

最新文章

标签