是否有可能编写一个正则表达式来匹配出现未知次数的嵌套模式?例如,当在外花括号内嵌套了未知数量的开/闭花括号时,正则表达式是否可以匹配开/闭花括号?

例如:

public MyMethod()
{
  if (test)
  {
    // More { }
  }

  // More { }
} // End

应该匹配:

{
  if (test)
  {
    // More { }
  }

  // More { }
}

当前回答

是的,如果它是。net RegEx-engine. net引擎支持有限状态机提供一个外部堆栈。看到细节

其他回答

不,你在这一点上进入了上下文自由语法的领域。

是的,如果它是。net RegEx-engine. net引擎支持有限状态机提供一个外部堆栈。看到细节

使用正则表达式检查嵌套模式非常简单。

'/(\((?>[^()]+|(?1))*\))/'

/(\{(?:\{.*\}|[^\{])*\})/m

常规语言的泵浦引理是您不能这样做的原因。

生成的自动机将有有限数量的状态,比如k,所以一个由k+1个开括号组成的字符串必然在某个地方有一个重复的状态(当自动机处理字符时)。相同状态之间的字符串部分可以复制无限次,自动机不会知道其中的区别。

特别是,如果它接受k+1个开大括号,后面跟着k+1个闭大括号(它应该),它也会接受泵送的开大括号数量,后面跟着不变的k+1个闭大括号(它不应该)。