从文件中获取第n行的Bash工具

有没有一种“规范”的方法？我一直在使用head-n|tail-1来完成这个任务，但我一直在想是否有一个Bash工具专门从文件中提取一行（或一系列行）。

我所说的“规范”是指一个主要功能就是这样做的程序。

当前回答

我将上面的一些答案放入了一个简短的bash脚本中，您可以将其放入名为get.sh的文件中，并链接到/usr/local/bin/get（或您喜欢的任何其他名称）。

#!/bin/bash
if [ "${1}" == "" ]; then
    echo "error: blank line number";
    exit 1
fi
re='^[0-9]+$'
if ! [[ $1 =~ $re ]] ; then
    echo "error: line number arg not a number";
    exit 1
fi
if [ "${2}" == "" ]; then
    echo "error: blank file name";
    exit 1
fi
sed "${1}q;d" $2;
exit 0

确保它可通过

$ chmod +x get

将其链接以使其在PATH上可用

$ ln -s get.sh /usr/local/bin/get

2019-01-28 15:22:05

其他回答

您也可以使用Perl实现这一点：

perl -wnl -e '$.== NUM && print && exit;' some.file

2011-05-16 19:43:41

有了awk，速度相当快：

awk 'NR == num_line' file

如果为true，则执行awk的默认行为：｛print$0｝。

替代版本

如果您的文件恰好很大，最好在读取所需的行后退出。这样可以节省CPU时间请参见答案末尾的时间比较。

awk 'NR == num_line {print; exit}' file

如果要从bash变量中给出行号，可以使用：

awk 'NR == n' n=$num file
awk -v n=$num 'NR == n' file   # equivalent

查看使用exit节省了多少时间，特别是如果该行恰好位于文件的第一部分：

# Let's create a 10M lines file
for ((i=0; i<100000; i++)); do echo "bla bla"; done > 100Klines
for ((i=0; i<100; i++)); do cat 100Klines; done > 10Mlines

$ time awk 'NR == 1234567 {print}' 10Mlines
bla bla

real    0m1.303s
user    0m1.246s
sys 0m0.042s
$ time awk 'NR == 1234567 {print; exit}' 10Mlines
bla bla

real    0m0.198s
user    0m0.178s
sys 0m0.013s

因此，两者的差异是0.198秒对1.303秒，大约快了6倍。

2014-01-22 09:49:02

您也可以使用sed打印并退出：

sed -n '10{p;q;}' file   # print line 10

2011-05-17 11:49:24

这个问题被标记为Bash，下面是Bash（≥4）的方法：使用带有-s（跳过）和-n（计数）选项的mapfile。

如果需要获取文件文件的第42行：

mapfile -s 41 -n 1 ary < file

此时，您将得到一个数组ary，其中的字段包含文件行（包括尾部换行符），我们跳过了前41行（-s 41），并在读取一行（-n 1）后停止。这真的是第42行。要打印出来：

printf '%s' "${ary[0]}"

如果您需要一系列行，请说出范围42–666（含），并说您不想自己计算，然后将它们打印在标准输出上：

mapfile -s $((42-1)) -n $((666-42+1)) ary < file
printf '%s' "${ary[@]}"

如果您也需要处理这些行，那么存储尾随换行符并不太方便。在这种情况下，使用-t选项（trim）：

mapfile -t -s $((42-1)) -n $((666-42+1)) ary < file
# do stuff
printf '%s\n' "${ary[@]}"

你可以让一个函数为你做这件事：

print_file_range() {
    # $1-$2 is the range of file $3 to be printed to stdout
    local ary
    mapfile -s $(($1-1)) -n $(($2-$1+1)) ary < "$3"
    printf '%s' "${ary[@]}"
}

没有外部命令，只有Bash内置命令！

2014-05-17 13:45:29

获取第n行（单行）

如果您想要一些以后可以自定义而不必处理bash的东西，可以编译这个c程序，并将二进制文件放到您的自定义二进制文件目录中。这假设您知道如何编辑.bashrc文件相应地（仅当您想要编辑路径变量时），如果您不知道，这是一个有用的链接。

要运行此代码，请使用（假设您将二进制代码命名为“行”）。

line [target line] [target file]

实例

line 2 somefile.txt

代码：

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int main(int argc, char* argv[]){

  if(argc != 3){
      fprintf(stderr, "line needs a line number and a file name");
      exit(0);     
  }

  int lineNumber = atoi(argv[1]); 
  int counter = 0; 
  char *fileName = argv[2];

  FILE *fileReader = fopen(fileName, "r");
  if(fileReader == NULL){
      fprintf(stderr, "Failed to open file"); 
      exit(0); 
  }

  size_t lineSize = 0;
  char* line = NULL;

  while(counter < lineNumber){
     getline(&line, &linesize, fileReader);
     counter++
  }

  getline(&line, &lineSize, fileReader);

  printf("%s\n", line);     

  fclose(fileReader); 
  return 0; 
}

EDIT：删除fseek并用while循环替换它

2022-11-23 06:16:40

从文件中获取第n行的Bash工具

推荐文章

最新文章

标签