我知道我可以否定[^bar]中的一组字符,但我需要一个正则表达式,其中否定适用于特定单词-所以在我的示例中,我如何否定一个实际的条,而不是“条中的任何字符”?


当前回答

摘自bkDJ的评论:

^(?!bar$).*

此解决方案的优点是可以明确否定(排除)多个单词:

^(?!bar$|foo$|banana$).*

其他回答

要做到这一点,一个很好的方法是使用负面展望:

^(?!.*bar).*$

负先行结构是一对括号,左括号后跟问号和感叹号。在lookahead内部[是任何正则表达式模式]。

接受的答案很好,但对于正则表达式中缺少简单的子表达式否定运算符来说,这确实是一个解决方案。这就是grep-invert匹配退出的原因。因此,在*nixes中,您可以使用管道和第二个正则表达式来实现所需的结果。

grep 'something I want' | grep --invert-match 'but not these ones'

仍然是一种变通方法,但可能更容易记住。

我有一个文件名列表,我想通过这种行为(Ruby)排除某些文件名:

files = [
  'mydir/states.rb',      # don't match these
  'countries.rb',
  'mydir/states_bkp.rb',  # match these
  'mydir/city_states.rb' 
]
excluded = ['states', 'countries']

# set my_rgx here

result = WankyAPI.filter(files, my_rgx)  # I didn't write WankyAPI...
assert result == ['mydir/city_states.rb', 'mydir/states_bkp.rb']

以下是我的解决方案:

excluded_rgx = excluded.map{|e| e+'\.'}.join('|')
my_rgx = /(^|\/)((?!#{excluded_rgx})[^\.\/]*)\.rb$/

我对此应用程序的假设:

要排除的字符串位于输入的开头,或紧跟在斜线之后。允许的字符串以.rb结尾。允许的文件名没有。.rb之前的字符。

摘自bkDJ的评论:

^(?!bar$).*

此解决方案的优点是可以明确否定(排除)多个单词:

^(?!bar$|foo$|banana$).*

我想补充已接受的答案,并用我迟来的答案为讨论作出贡献。

@ChrisVanOpstal分享了这个正则表达式教程,这是学习正则表达式的一个很好的资源。

然而,通读起来确实很耗时。

为了便于记忆,我做了一张备忘单。

这个引用基于每个类前面的大括号[]、()和{},我觉得很容易回忆起来。

Regex = {
 'single_character': ['[]', '.', {'negate':'^'}],
 'capturing_group' : ['()', '|', '\\', 'backreferences and named group'],
 'repetition'      : ['{}', '*', '+', '?', 'greedy v.s. lazy'],
 'anchor'          : ['^', '\b', '$'],
 'non_printable'   : ['\n', '\t', '\r', '\f', '\v'],
 'shorthand'       : ['\d', '\w', '\s'],
 }