如何从Unix上的文本文件中提取预先确定的行范围?

我有一个~23000行的SQL转储，其中包含几个数据库的数据价值。我需要提取这个文件的某个部分(即单个数据库的数据)，并将其放在一个新文件中。我知道我想要的数据的开始行号和结束行号。

谁知道一个Unix命令(或一系列命令)可以从文件中提取16224到16482行之间的所有行，然后将它们重定向到一个新文件中?

当前回答

我一直在寻找这个问题的答案，但最终我不得不编写自己的代码。以上的答案都不令人满意。假设您有一个非常大的文件，并且有一些想要打印的行号，但这些行号不是按顺序排列的。您可以执行以下操作:

我的文件比较大对于{a..k};执行echo $letter;完成| cat -n > myfile.txt

我想要的具体行号: shuf -i 1-11 -n 4 > line_numbers_I_want.txt

要打印这些行号，请执行以下操作。 awk ` {system("head myfile.txt -n " $0 " | tail -n 1")} ` line_numbers_I_want.txt

上面所做的是头n行，然后采取最后一行使用尾巴

如果您希望行号按顺序排列，首先sort (is -n numeric sort)，然后获取行。

cat line_numbers_I_want.txt | sort -n | awk '{system("head myfile.txt -n " $0 " | tail -n 1")}'

其他回答

使用head/tail非常简单:

head -16482 in.sql | tail -258 > out.sql

使用sed:

sed -n '16224,16482p' in.sql > out.sql

使用awk:

awk 'NR>=16224&&NR<=16482' in.sql > out.sql

我们甚至可以在命令行检查:

cat filename|sed 'n1,n2!d' > abc.txt

例如:

cat foo.pl|sed '100,200!d' > abc.txt

sed -n '16224,16482 p' orig-data-file > new-file

其中16224、16482是起始行号和结束行号，包括。这是1索引。-n抑制将输入回显为输出，这显然不是你想要的;数字表示要执行以下命令的行范围;命令p输出相关的行。

我写了一个叫做splitter的Haskell程序，它就是这样做的:阅读我发布的博客文章。

您可以使用该程序如下:

$ cat somefile | splitter 16224-16482

这就是它的全部。您将需要Haskell来安装它。只是:

$ cabal install splitter

这样就做完了。我希望这个程序对您有用。

我会用:

awk 'FNR >= 16224 && FNR <= 16482' my_file > extracted.txt

FNR包含从文件中读取的行的记录(行)号。

推荐文章