什么是正则表达式中的非捕获组？

如何在正则表达式中使用非捕获组，即（？：），它们有什么好处？

当前回答

打开您的Google Chrome devTools，然后单击Console选项卡：并键入以下内容：

"Peace".match(/(\w)(\w)(\w)/)

运行它，您将看到：

["Pea", "P", "e", "a", index: 0, input: "Peace", groups: undefined]

JavaScript RegExp引擎捕获三个组，索引为1、2、3的项。现在使用非捕获标记来查看结果。

"Peace".match(/(?:\w)(\w)(\w)/)

结果是：

["Pea", "e", "a", index: 0, input: "Peace", groups: undefined]

这是显而易见的非捕获组。

其他回答

您可以使用捕获组来组织和分析表达式。非捕获组具有第一个好处，但没有第二个好处的开销。例如，您仍然可以说非捕获组是可选的。

假设你想匹配数字文本，但有些数字可以写成1、2、3、4，。。。如果要捕获数字部分，而不是（可选）后缀，则可以使用非捕获组。

([0-9]+)(?:st|nd|rd|th)?

这将匹配形式1、2、3…或形式1、第2、第3…的数字，。。。但它将只捕获数字部分。

历史动机：

非捕获组的存在可以用括号来解释。

考虑表达式（a|b）c和a|bc，由于串联优先于|，这些表达式分别表示两种不同的语言（{ac，bc}和{a，bc}）。

然而，括号也用作匹配组（如其他答案所解释的…）。

当您想有括号但不想捕获子表达式时，可以使用NON-CAPTURING GROUPS。在示例中，（？：a|b）c

打开您的Google Chrome devTools，然后单击Console选项卡：并键入以下内容：

"Peace".match(/(\w)(\w)(\w)/)

运行它，您将看到：

["Pea", "P", "e", "a", index: 0, input: "Peace", groups: undefined]

JavaScript RegExp引擎捕获三个组，索引为1、2、3的项。现在使用非捕获标记来查看结果。

"Peace".match(/(?:\w)(\w)(\w)/)

结果是：

["Pea", "e", "a", index: 0, input: "Peace", groups: undefined]

这是显而易见的非捕获组。

我不能评论最上面的答案来这样说：我想补充一个明确的观点，这只是在最上面的回答中暗示的：

非捕获组（？…）不会从原始完全匹配中删除任何字符，它只会对程序员进行可视化的正则表达式重组。

要访问正则表达式的特定部分而不定义外来字符，您将始终需要使用.group（<index>）

它使组不捕获，这意味着该组匹配的子字符串将不包含在捕获列表中。ruby中的一个示例说明了区别：

"abc".match(/(.)(.)./).captures #=> ["a","b"]
"abc".match(/(?:.)(.)./).captures #=> ["b"]

推荐文章