如何从文件中读取特定的行(按行号)?

我使用for循环来读取文件，但我只想读取特定的行，比如第26行和第30行。是否有任何内置功能来实现这一点?

当前回答

一个快速而紧凑的方法可以是:

def picklines(thefile, whatlines):
  return [x for i, x in enumerate(thefile) if i in whatlines]

它接受任何打开的类文件对象thefile(由调用者决定是否应该从磁盘文件打开，还是通过例如套接字或其他类文件流打开)和一组从零开始的行索引whatlines，并返回一个具有低内存占用和合理速度的列表。如果要返回的行数非常多，你可能更喜欢使用生成器:

def yieldlines(thefile, whatlines):
  return (x for i, x in enumerate(thefile) if i in whatlines)

这基本上只适用于循环——注意，唯一的区别是在return语句中使用圆括号而不是方括号，分别生成一个列表推导式和一个生成器表达式。

进一步注意，尽管提到了“行”和“文件”，但这些函数要通用得多——它们可以在任何可迭代对象上工作，无论是打开的文件还是其他文件，根据逐级递增的项号返回项的列表(或生成器)。所以，我建议使用更合适的通用名称;-)。

2010-01-17 18:42:19

其他回答

我更喜欢这种方法，因为它更通用，即你可以在文件上使用它，在f.r edlines()的结果上，在StringIO对象上，无论什么:

def read_specific_lines(file, lines_to_read):
   """file is any iterable; lines_to_read is an iterable containing int values"""
   lines = set(lines_to_read)
   last = max(lines)
   for n, line in enumerate(file):
      if n + 1 in lines:
          yield line
      if n + 1 > last:
          return

>>> with open(r'c:\temp\words.txt') as f:
        [s for s in read_specific_lines(f, [1, 2, 3, 1000])]
['A\n', 'a\n', 'aa\n', 'accordant\n']

2010-01-17 18:37:36

简单的回答是:

f=open('filename')
lines=f.readlines()
print lines[25]
print lines[29]

or:

lines=[25, 29]
i=0
f=open('filename')
for line in f:
    if i in lines:
        print i
    i+=1

有一个更优雅的解决方案来提取许多行:linecache(由“python:如何跳转到一个巨大文本文件中的特定行?”提供，这是stackoverflow.com之前的一个问题)。

引用上面链接的python文档:

>>> import linecache
>>> linecache.getline('/etc/passwd', 4)
'sys:x:3:3:sys:/dev:/bin/sh\n'

将4更改为您想要的行号，然后就开始了。注意，4将带来第五行，因为计数是从零开始的。

如果文件非常大，并且在读入内存时会出现问题，那么接受@Alok的建议并使用enumerate()可能是个好主意。

结论:

使用fileobject.readlines()或fileobject中的for line作为小文件的快速解决方案。使用linecache作为一个更优雅的解决方案，它将非常快地读取许多文件，可能是重复的。采纳@Alok的建议，使用enumerate()来处理可能非常大的文件，并且不适合内存。注意，使用此方法可能会变慢，因为文件是按顺序读取的。

2010-01-17 17:18:47

如果要读取的文件很大，并且你不想一次在内存中读取整个文件:

fp = open("file")
for i, line in enumerate(fp):
    if i == 25:
        # 26th line
    elif i == 29:
        # 30th line
    elif i > 29:
        break
fp.close()

注意第n行i == n-1。

在Python 2.6或更高版本中:

with open("file") as fp:
    for i, line in enumerate(fp):
        if i == 25:
            # 26th line
        elif i == 29:
            # 30th line
        elif i > 29:
            break

2010-01-17 17:23:01

我认为这行得通

 open_file1 = open("E:\\test.txt",'r')
 read_it1 = open_file1.read()
 myline1 = []
 for line1 in read_it1.splitlines():
 myline1.append(line1)
 print myline1[0]

2015-04-10 06:05:04

不要使用阅读线!

我的解决方案是:


with open(filename) as f:
    specify = [26, 30]
    results = list(
        map(lambda line: line[1],
            filter(lambda line: line[0] in specify,
                   enumerate(f))
            )
    )

对6.5G文件进行如下测试:

import time

filename = 'a.txt'
start = time.time()
with open(filename, 'w') as f:
    for i in range(10_000_000):
        f.write(f'{str(i)*100}\n')       
end1 = time.time()

with open(filename) as f:
    specify = [26, 30]
    results = list(
        map(lambda line: line[1],
            filter(lambda line: line[0] in specify,
                   enumerate(f))
            )
    )
end2 = time.time()
print(f'write time: {end1-start}')
print(f'read time: {end2-end1}')
# write time: 14.38945460319519
# read time: 8.380386352539062

2022-04-07 13:01:15

如何从文件中读取特定的行(按行号)?

推荐文章

最新文章

标签