什么是正则表达式中的非捕获组？

如何在正则表达式中使用非捕获组，即（？：），它们有什么好处？

当前回答

您可以使用捕获组来组织和分析表达式。非捕获组具有第一个好处，但没有第二个好处的开销。例如，您仍然可以说非捕获组是可选的。

假设你想匹配数字文本，但有些数字可以写成1、2、3、4，。。。如果要捕获数字部分，而不是（可选）后缀，则可以使用非捕获组。

([0-9]+)(?:st|nd|rd|th)?

这将匹配形式1、2、3…或形式1、第2、第3…的数字，。。。但它将只捕获数字部分。

2010-08-18 13:24:36

其他回答

我想我会给你答案。在未检查匹配是否成功的情况下，不要使用捕获变量。

除非匹配成功，否则捕获变量$1等无效，并且它们也不会被清除。

#!/usr/bin/perl  
use warnings;
use strict;   
$_ = "bronto saurus burger";
if (/(?:bronto)? saurus (steak|burger)/)
{
    print "Fred wants a  $1";
}
else
{
    print "Fred dont wants a $1 $2";
}

在上面的示例中，为了避免在$1中捕获bronto，使用了（？：）。

如果模式匹配，则$1被捕获为下一个分组模式。

因此，输出如下：

Fred wants a burger

如果不希望保存匹配项，则此选项很有用。

2017-05-23 13:40:43

?: 当您想对表达式进行分组，但不想将其保存为字符串的匹配/捕获部分时，使用。

一个例子是匹配IP地址：

/(?:\d{1,3}\.){3}\d{1,3}/

请注意，我不在乎保存前3个八位字节，但（？：…）分组允许我缩短正则表达式，而不会导致捕获和存储匹配项的开销。

2010-08-18 13:22:05

历史动机：

非捕获组的存在可以用括号来解释。

考虑表达式（a|b）c和a|bc，由于串联优先于|，这些表达式分别表示两种不同的语言（{ac，bc}和{a，bc}）。

然而，括号也用作匹配组（如其他答案所解释的…）。

当您想有括号但不想捕获子表达式时，可以使用NON-CAPTURING GROUPS。在示例中，（？：a|b）c

2016-02-04 08:07:28

在复杂的正则表达式中，可能会出现这样的情况：您希望使用大量的组，其中一些组用于重复匹配，另一些组用于提供反向引用。默认情况下，匹配每个组的文本将加载到backreference数组中。如果我们有很多组，并且只需要能够从backreference数组中引用其中的一些组，我们可以重写此默认行为，告诉正则表达式某些组只用于重复处理，不需要捕获并存储在backreference阵列中。

2014-03-08 17:33:15

捕获的组可以稍后在正则表达式中使用以匹配，也可以在正则表达式的替换部分中使用它们。创建一个非捕获组只会使该组免于出于以下原因之一而被使用。

如果你试图捕捉很多不同的东西，而有些群体你不想捕捉，那么非捕捉群体是很好的。

这就是它们存在的原因。当你学习团体时，学习原子团体，他们做了很多！也有环视组，但它们有点复杂，而且使用得不多。

稍后在正则表达式中使用的示例（backreference）：

<（[A-Z][A-Z0-9]*）\b[^>]*>.*</\1> [查找xml标记（不支持ns）]

（[A-Z][A-Z0-9]*）是一个捕获组（在本例中是标记名）

稍后在正则表达式中是\ 1，这意味着它将仅与第一组（[A-Z][A-Z0-9]*）中的相同文本匹配（在本例中，它与结束标记匹配）。

2010-08-18 13:22:48

什么是正则表达式中的非捕获组？

推荐文章

最新文章

标签