我试图使用grep来匹配包含两个不同字符串的行。我已经尝试了以下方法,但这匹配了包含不是我想要的string1或string2的行。

grep 'string1\|string2' filename

那么我如何匹配与grep只包含两个字符串的行?


当前回答

ripgrep

下面是使用rg的例子:

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的抓取工具之一,因为它建立在Rust的正则引擎之上,该引擎使用有限自动机、SIMD和积极的文字优化来使搜索非常快。

使用它,特别是在处理大量数据时。

参见GH-875中的相关功能请求。

其他回答

如果git被初始化并添加到分支,那么最好使用git grep,因为它非常快,它会在整个目录内搜索。

git grep 'string1.*string2.*string3'

我经常遇到和你一样的问题,我刚刚写了一段脚本:

function m() { # m means 'multi pattern grep'

    function _usage() {
    echo "usage: COMMAND [-inH] -p<pattern1> -p<pattern2> <filename>"
    echo "-i : ignore case"
    echo "-n : show line number"
    echo "-H : show filename"
    echo "-h : show header"
    echo "-p : specify pattern"
    }

    declare -a patterns
    # it is important to declare OPTIND as local
    local ignorecase_flag  filename linum header_flag colon result OPTIND

    while getopts "iHhnp:" opt; do
    case $opt in
        i)
        ignorecase_flag=true ;;
        H)
        filename="FILENAME," ;;
        n)
        linum="NR," ;;
        p)
        patterns+=( "$OPTARG" ) ;;
        h)
        header_flag=true ;;
        \?)
        _usage
        return ;;
    esac
    done

    if [[ -n $filename || -n $linum ]]; then
    colon="\":\","
    fi

    shift $(( $OPTIND - 1 ))

    if [[ $ignorecase_flag == true ]]; then
    for s in "${patterns[@]}"; do
            result+=" && s~/${s,,}/"
    done
    result=${result# && }
    result="{s=tolower(\$0)} $result"
    else
    for s in "${patterns[@]}"; do
            result="$result && /$s/"
    done
    result=${result# && }
    fi

    result+=" { print "$filename$linum$colon"\$0 }"

    if [[ ! -t 0 ]]; then       # pipe case
    cat - | awk "${result}"
    else
    for f in "$@"; do
        [[ $header_flag == true ]] && echo "########## $f ##########"
        awk "${result}" $f
    done
    fi
}

用法:

echo "a b c" | m -p A 
echo "a b c" | m -i -p A # a b c

你可以把它放在。bashrc中。

git grep

下面是使用多种模式的git grep的语法:

git grep --all-match --no-index -l -e string1 -e string2 -e string3 file

您还可以将模式与布尔表达式结合使用,例如——and、——or和——not。

向git-grep求助。


——all-match当给出多个模式表达式时,指定该标志将匹配限制在包含所有匹配行的文件上。 ——no-index搜索当前目录下不受Git管理的文件。 -l/——files-with-matches/——name-only只显示文件名。 -e下一个参数是模式。默认是使用基本的regexp。

其他需要考虑的参数:

——threads使用的grep worker线程数。 -q/——quiet/——silent不输出匹配的行;当有匹配时,以状态0退出。

要更改模式类型,还可以使用-G/——basic-regexp(默认)、-F/——fixed-strings、-E/——extended-regexp、-P/——perl-regexp、-F file和其他。

相关:

如何grep存在于同一行上的两个单词? 检查文件中是否存在多个字符串或正则表达式 如何运行grep与多个与模式?&匹配文件中的所有模式

OR操作请参见:

我如何grep多个模式与模式有一个管道字符? 如何添加“或”条件?

发现仅以6个空格开始并以以下内容结束的行:

 cat my_file.txt | grep
 -e '^      .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
 -e '^      .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
 > nolog.txt
grep '(string1.*string2 | string2.*string1)' filename

将得到line与string1和string2在任何顺序