什么是正则表达式中的非捕获组？

如何在正则表达式中使用非捕获组，即（？：），它们有什么好处？

当前回答

我不能评论最上面的答案来这样说：我想补充一个明确的观点，这只是在最上面的回答中暗示的：

非捕获组（？…）不会从原始完全匹配中删除任何字符，它只会对程序员进行可视化的正则表达式重组。

要访问正则表达式的特定部分而不定义外来字符，您将始终需要使用.group（<index>）

2018-01-02 01:04:00

其他回答

我是一名JavaScript开发人员，将尝试解释其与JavaScript相关的意义。

考虑一个场景，你想将猫与动物相匹配当你想要匹配猫和动物时，两者之间应该有一个平衡点。

 // this will ignore "is" as that's is what we want
"cat is animal".match(/(cat)(?: is )(animal)/) ;
result ["cat is animal", "cat", "animal"]

 // using lookahead pattern it will match only "cat" we can
 // use lookahead but the problem is we can not give anything
 // at the back of lookahead pattern
"cat is animal".match(/cat(?= is animal)/) ;
result ["cat"]

 //so I gave another grouping parenthesis for animal
 // in lookahead pattern to match animal as well
"cat is animal".match(/(cat)(?= is (animal))/) ;
result ["cat", "cat", "animal"]

 // we got extra cat in above example so removing another grouping
"cat is animal".match(/cat(?= is (animal))/) ;
result ["cat", "animal"]

2016-03-01 09:43:52

我想我会给你答案。在未检查匹配是否成功的情况下，不要使用捕获变量。

除非匹配成功，否则捕获变量$1等无效，并且它们也不会被清除。

#!/usr/bin/perl  
use warnings;
use strict;   
$_ = "bronto saurus burger";
if (/(?:bronto)? saurus (steak|burger)/)
{
    print "Fred wants a  $1";
}
else
{
    print "Fred dont wants a $1 $2";
}

在上面的示例中，为了避免在$1中捕获bronto，使用了（？：）。

如果模式匹配，则$1被捕获为下一个分组模式。

因此，输出如下：

Fred wants a burger

如果不希望保存匹配项，则此选项很有用。

2017-05-23 13:40:43

为了补充本主题中的其他好答案，我想添加一个有趣的观察结果。

查找：您可以在非捕获组中包含捕获组。

问题详细信息：请查看下面匹配web URL的正则表达式：

var parse_url_regex = /^(?:([A-Za-z]+):)(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;

以下是我的输入url字符串：

var url = "http://www.ora.com:80/goodparts?q#fragment";

正则表达式中的第一个组（？：（[A-Za-z]+）：）是一个非捕获组，它匹配协议方案（http）和冒号（：）字符。继续，它变为http:。但当我运行以下代码时：

console.debug(parse_url_regex.exec(url));

我可以看到返回数组的第一个索引包含字符串http（请参阅屏幕截图）。

此时，我的想法是http和冒号：两者都不会在输出中报告，因为它们位于非捕获组中。如果第一个正则表达式组（？：（[A-Za-z]+）：）是非捕获组，那么为什么它在输出数组中返回http字符串？

解释：如果你注意到，（[A-Za-z]+）是一个捕获组（开头没有？）。但这个捕获组本身位于一个非捕获组（？：（[a-Za-z]+）：）内，后面跟着一个：字符。这就是为什么文本http仍然被捕获，但冒号：字符落在非捕获组内（但在捕获组外），不会在输出数组中报告。

2017-07-15 03:13:01

打开您的Google Chrome devTools，然后单击Console选项卡：并键入以下内容：

"Peace".match(/(\w)(\w)(\w)/)

运行它，您将看到：

["Pea", "P", "e", "a", index: 0, input: "Peace", groups: undefined]

JavaScript RegExp引擎捕获三个组，索引为1、2、3的项。现在使用非捕获标记来查看结果。

"Peace".match(/(?:\w)(\w)(\w)/)

结果是：

["Pea", "e", "a", index: 0, input: "Peace", groups: undefined]

这是显而易见的非捕获组。

2018-05-07 03:50:43

在复杂的正则表达式中，可能会出现这样的情况：您希望使用大量的组，其中一些组用于重复匹配，另一些组用于提供反向引用。默认情况下，匹配每个组的文本将加载到backreference数组中。如果我们有很多组，并且只需要能够从backreference数组中引用其中的一些组，我们可以重写此默认行为，告诉正则表达式某些组只用于重复处理，不需要捕获并存储在backreference阵列中。

2014-03-08 17:33:15

什么是正则表达式中的非捕获组？

推荐文章

最新文章

标签