如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

下面是一个受到这个答案启发的解决方案:

如果'abc'和'efg'可以在同一行: Grep -zl 'abc。*efg' <您的文件列表> 如果'abc'和'efg'必须在不同的行上: grep -Pzl '(?s)abc.*\n.;*efg' <您的文件列表>

参数:

-P使用perl兼容的正则表达式。将输入视为一组行，每一行以0字节结束，而不是换行符。例如，grep将输入视为一行。注意，如果你不使用-l，它将显示匹配后的NUL字符，见注释。 -l list只匹配文件名。 (?s)激活PCRE_DOTALL，这意味着'。'查找任何字符或换行符。

其他回答

虽然sed选项是最简单、最简单的，但遗憾的是，LJ的一行程序并不是最可移植的。那些受困于C Shell(而不是bash)版本的人将需要摆脱他们的刘海:

sed -e '/abc/,/efg/\!d' [file]

不幸的是，这一行在bash等中不起作用。

随着几个月前ugrep的发布:

ugrep 'abc(\n|.)+?efg'

这个工具是高度优化的速度。它也是GNU/BSD/PCRE-grep兼容的。

注意我们应该使用惰性重复+?，除非您想将所有efg行匹配在一起，直到文件中的最后一个efg。

这应该可以工作:

cat FILE | egrep 'abc|efg'

如果有多个匹配项，可以使用grep -v过滤掉

遗憾的是，你不能。来自grep文档:

grep搜索指定的输入FILEs(或标准输入，如果没有指定文件，或如果给出了一个连字符减号(-)作为文件名)，以查找包含与给定PATTERN匹配的行。

Grep是这种操作的笨拙工具。

在大多数现代Linux系统中都可以找到pcregrep，可以用作

pcregrep -M  'abc.*(\n|.)*efg' test.txt

where -M，——multiline允许模式匹配多行

还有一个更新的pcre2grep。两者都是由PCRE项目提供的。

pcre2grep可以通过Mac Ports作为pcre2端口的一部分用于Mac OS X:

% sudo port install pcre2

并通过Homebrew为:

% brew install pcre

或者pcre2

% brew install pcre2

pcre2grep在Linux (Ubuntu 18.04+)上也可用

$ sudo apt install pcre2-utils # PCRE2
$ sudo apt install pcregrep    # Older PCRE

推荐文章