如何从Unix上的文本文件中提取预先确定的行范围?

我有一个~23000行的SQL转储，其中包含几个数据库的数据价值。我需要提取这个文件的某个部分(即单个数据库的数据)，并将其放在一个新文件中。我知道我想要的数据的开始行号和结束行号。

谁知道一个Unix命令(或一系列命令)可以从文件中提取16224到16482行之间的所有行，然后将它们重定向到一个新文件中?

当前回答

我会用:

awk 'FNR >= 16224 && FNR <= 16482' my_file > extracted.txt

FNR包含从文件中读取的行的记录(行)号。

其他回答

cat dump.txt | head -16224 | tail -258

应该能行。这种方法的缺点是，您需要做算术来确定tail的参数，并考虑是否希望“between”包含结束行。

使用ruby:

ruby -ne 'puts "#{$.}: #{$_}" if $. >= 32613500 && $. <= 32614500' < GND.rdf > GND.extract.rdf

awk还有另一种方法:

awk 'NR==16224, NR==16482' file

如果文件很大，最好在读取最后一行之后退出。这样，它就不会不必要地读取以下行:

awk 'NR==16224, NR==16482-1; NR==16482 {print; exit}' file

awk 'NR==16224, NR==16482; NR==16482 {exit}' file

我们甚至可以在命令行检查:

cat filename|sed 'n1,n2!d' > abc.txt

例如:

cat foo.pl|sed '100,200!d' > abc.txt

接受答案中的-n起作用。如果你有兴趣的话，还有另一种方法。

cat $filename | sed "${linenum}p;d";

它的作用如下:

管道插入文件的内容(或根据需要输入文本)。 Sed选择给定的行，打印它 D必须删除行，否则sed将假定最终打印所有行。也就是说，如果没有d，你将得到被选中行打印的所有行打印两次，因为你有${linenum}p部分要求打印它。我很确定-n和这里的d是一样的。

推荐文章