如何从文件中读取特定的行(按行号)?

我使用for循环来读取文件，但我只想读取特定的行，比如第26行和第30行。是否有任何内置功能来实现这一点?

当前回答

读取文件非常快。读取一个100MB的文件需要不到0.1秒(请参阅我的文章用Python读写文件)。因此，你应该完整地阅读它，然后处理单行。

大多数回答这里做的不是错，而是风格不好。打开文件应该总是用with，因为它可以确保文件再次关闭。

所以你应该这样做:

with open("path/to/file.txt") as f:
    lines = f.readlines()
print(lines[26])  # or whatever you want to do with this line
print(lines[30])  # or whatever you want to do with this line

巨大的文件

如果你有一个巨大的文件，内存消耗是一个问题，你可以逐行处理它:

with open("path/to/file.txt") as f:
    for i, line in enumerate(f):
        pass  # process line i

2015-03-23 20:41:26

其他回答

一个快速而紧凑的方法可以是:

def picklines(thefile, whatlines):
  return [x for i, x in enumerate(thefile) if i in whatlines]

它接受任何打开的类文件对象thefile(由调用者决定是否应该从磁盘文件打开，还是通过例如套接字或其他类文件流打开)和一组从零开始的行索引whatlines，并返回一个具有低内存占用和合理速度的列表。如果要返回的行数非常多，你可能更喜欢使用生成器:

def yieldlines(thefile, whatlines):
  return (x for i, x in enumerate(thefile) if i in whatlines)

这基本上只适用于循环——注意，唯一的区别是在return语句中使用圆括号而不是方括号，分别生成一个列表推导式和一个生成器表达式。

进一步注意，尽管提到了“行”和“文件”，但这些函数要通用得多——它们可以在任何可迭代对象上工作，无论是打开的文件还是其他文件，根据逐级递增的项号返回项的列表(或生成器)。所以，我建议使用更合适的通用名称;-)。

2010-01-17 18:42:19

从某一行读出:

n = 4   # for reading from 5th line
with open("write.txt",'r') as t:
     for i,line in enumerate(t):
         if i >= n:             # i == n-1 for nth line
            print(line)

2020-07-05 12:35:59

简单的回答是:

f=open('filename')
lines=f.readlines()
print lines[25]
print lines[29]

or:

lines=[25, 29]
i=0
f=open('filename')
for line in f:
    if i in lines:
        print i
    i+=1

有一个更优雅的解决方案来提取许多行:linecache(由“python:如何跳转到一个巨大文本文件中的特定行?”提供，这是stackoverflow.com之前的一个问题)。

引用上面链接的python文档:

>>> import linecache
>>> linecache.getline('/etc/passwd', 4)
'sys:x:3:3:sys:/dev:/bin/sh\n'

将4更改为您想要的行号，然后就开始了。注意，4将带来第五行，因为计数是从零开始的。

如果文件非常大，并且在读入内存时会出现问题，那么接受@Alok的建议并使用enumerate()可能是个好主意。

结论:

使用fileobject.readlines()或fileobject中的for line作为小文件的快速解决方案。使用linecache作为一个更优雅的解决方案，它将非常快地读取许多文件，可能是重复的。采纳@Alok的建议，使用enumerate()来处理可能非常大的文件，并且不适合内存。注意，使用此方法可能会变慢，因为文件是按顺序读取的。

2010-01-17 17:18:47

如果你不介意导入，那么fileinput确实是你需要的(这是你可以读取当前行的行号)

2010-01-17 17:21:58

如果要读取的文件很大，并且你不想一次在内存中读取整个文件:

fp = open("file")
for i, line in enumerate(fp):
    if i == 25:
        # 26th line
    elif i == 29:
        # 30th line
    elif i > 29:
        break
fp.close()

注意第n行i == n-1。

在Python 2.6或更高版本中:

with open("file") as fp:
    for i, line in enumerate(fp):
        if i == 25:
            # 26th line
        elif i == 29:
            # 30th line
        elif i > 29:
            break

2010-01-17 17:23:01

如何从文件中读取特定的行(按行号)?

推荐文章

最新文章

标签