在正则表达式的上下文中，'lazy'和'greedy'是什么意思?

最好用例子来说明。字符串。192.168.1.1和一个贪婪的正则表达式\b.+\b 你可能认为这会给你第一个八位元，但实际上是匹配整个字符串。为什么?因为。+是贪婪的，贪婪匹配匹配192.168.1.1中的每个字符，直到它到达字符串的末尾。这是最重要的一点!现在它开始一次回溯一个字符，直到找到与第三个标记(\b)匹配的字符。

如果字符串一个4GB文本文件和192.168.1.1在开始，你可以很容易地看到这个回溯会导致一个问题。

要使正则表达式非贪婪(懒惰)，在你的贪婪搜索后放一个问号

*?
??
+?

现在发生的事情是令牌2(+?)找到一个匹配，regex沿着一个字符移动，然后尝试下一个令牌(\b)，而不是令牌2(+?)。所以它小心翼翼地爬行着。

2018-03-12 10:54:44

最好用例子来说明。字符串。192.168.1.1和一个贪婪的正则表达式\b.+\b 你可能认为这会给你第一个八位元，但实际上是匹配整个字符串。为什么?因为。+是贪婪的，贪婪匹配匹配192.168.1.1中的每个字符，直到它到达字符串的末尾。这是最重要的一点!现在它开始一次回溯一个字符，直到找到与第三个标记(\b)匹配的字符。

如果字符串一个4GB文本文件和192.168.1.1在开始，你可以很容易地看到这个回溯会导致一个问题。

要使正则表达式非贪婪(懒惰)，在你的贪婪搜索后放一个问号

*?
??
+?

现在发生的事情是令牌2(+?)找到一个匹配，regex沿着一个字符移动，然后尝试下一个令牌(\b)，而不是令牌2(+?)。所以它小心翼翼地爬行着。

2018-03-12 10:54:44

为了进一步说明懒惰，这里有一个例子，乍一看可能不太直观，但从Suganthan Madhavan Pillai的回答中解释了“逐渐扩大比赛”的想法。

input -> some.email@domain.com@
regex -> ^.*?@$

这个输入的Regex将有一个匹配。乍一看，有人可能会说LAZY match(".*?@")将在第一个@停止，之后它将检查输入字符串结束("$")。按照这个逻辑，有人会得出没有匹配的结论，因为输入字符串在第一个@之后没有结束。

但正如你所看到的，情况并非如此，即使我们使用非贪婪(懒惰模式)搜索，regex也会继续前进，直到它命中秒@并有一个MINIMAL匹配。

2022-07-30 11:47:27

Greedy quantifier	Lazy quantifier	Description
`*`	`*?`	Star Quantifier: 0 or more
`+`	`+?`	Plus Quantifier: 1 or more
`?`	`??`	Optional Quantifier: 0 or 1
`{n}`	`{n}?`	Quantifier: exactly n
`{n,}`	`{n,}?`	Quantifier: n or more
`{n,m}`	`{n,m}?`	Quantifier: between n and m

加一个?给量词，使其不贪婪，即懒惰。

例子: 测试字符串:stackoverflow 贪心reg表达式:s.*o输出:stackoverflow Lazy reg表达式:s.*?O输出:stackoverflow

2016-01-15 07:26:36

来自正则表达式

regular中的标准量词表达式是贪婪的，这意味着它们尽可能多地匹配，只给予回视需要进行匹配正则表达式的剩余部分。通过使用惰性量词，的表达式尝试最小匹配第一。

2010-02-20 06:21:22

'Greedy'表示匹配最长的字符串。

'Lazy'表示匹配最短的字符串。

例如，贪婪的h.+l匹配'hello'中的'hell'，但懒惰的h.+?L和“hel”匹配。

2010-02-20 06:19:41

在正则表达式的上下文中，'lazy'和'greedy'是什么意思?

推荐文章

最新文章

标签