什么是正则表达式中的非捕获组？

如何在正则表达式中使用非捕获组，即（？：），它们有什么好处？

当前回答

历史动机：

非捕获组的存在可以用括号来解释。

考虑表达式（a|b）c和a|bc，由于串联优先于|，这些表达式分别表示两种不同的语言（{ac，bc}和{a，bc}）。

然而，括号也用作匹配组（如其他答案所解释的…）。

当您想有括号但不想捕获子表达式时，可以使用NON-CAPTURING GROUPS。在示例中，（？：a|b）c

2016-02-04 08:07:28

其他回答

?: 当您想对表达式进行分组，但不想将其保存为字符串的匹配/捕获部分时，使用。

一个例子是匹配IP地址：

/(?:\d{1,3}\.){3}\d{1,3}/

请注意，我不在乎保存前3个八位字节，但（？：…）分组允许我缩短正则表达式，而不会导致捕获和存储匹配项的开销。

2010-08-18 13:22:05

简单的答案

使用它们来确保在这里出现几种可能性中的一种（？：一个|两个）或可选短语camp（？：站点）？或者一般来说，任何你想建立一个组/短语/部分而不需要特别提及的地方。

他们将您捕获的组数保持在最小值。

2021-07-07 21:39:14

在复杂的正则表达式中，可能会出现这样的情况：您希望使用大量的组，其中一些组用于重复匹配，另一些组用于提供反向引用。默认情况下，匹配每个组的文本将加载到backreference数组中。如果我们有很多组，并且只需要能够从backreference数组中引用其中的一些组，我们可以重写此默认行为，告诉正则表达式某些组只用于重复处理，不需要捕获并存储在backreference阵列中。

2014-03-08 17:33:15

您可以使用捕获组来组织和分析表达式。非捕获组具有第一个好处，但没有第二个好处的开销。例如，您仍然可以说非捕获组是可选的。

假设你想匹配数字文本，但有些数字可以写成1、2、3、4，。。。如果要捕获数字部分，而不是（可选）后缀，则可以使用非捕获组。

([0-9]+)(?:st|nd|rd|th)?

这将匹配形式1、2、3…或形式1、第2、第3…的数字，。。。但它将只捕获数字部分。

2010-08-18 13:24:36

（？：…）充当一个组（…），但不捕获匹配的数据。它确实比标准的捕获组效率高得多。当你想对某个东西进行分组，但以后不需要重用它时，就可以使用它了@托托

2021-04-24 10:43:08

什么是正则表达式中的非捕获组？

推荐文章

最新文章

标签