我需要从字符串中提取包含在两个分隔符之间的一组字符,而不返回分隔符本身。

一个简单的例子应该会有所帮助:

目标:提取方括号之间的子字符串,不返回方括号本身。

基本字符串:这是一个测试字符串[或多或少]

如果我使用下面的reg。前女友。

\[.*?\]

比赛[差不多]进行得很顺利。我只需要得到更多或更少(没有括号)。

有可能做到吗?


当前回答

我想在/和#之间找到一个字符串,但#有时是可选的。下面是我使用的正则表达式:

  (?<=\/)([^#]+)(?=#*)

其他回答

我在使用regex和bash脚本时遇到了同样的问题。 我使用了一个两步解决方案,使用管道并应用grep -o

 '\[(.*?)\]'  

首先,然后

'\b.*\b'

显然在其他答案上没有那么有效,但这是另一种选择。

如果使用JavaScript, cletus提供的解决方案(?<=\[)(.*?)(?=\])将不起作用,因为JavaScript不支持向后查找操作符。

编辑:实际上,现在(ES2018)可以使用向后查找操作符。只需要添加/来定义正则表达式字符串,就像这样:

var regex = /(?<=\[)(.*?)(?=\])/;

旧的回答:

解决方案:

var regex = /\[(.*?)\]/;
var strToMatch = "This is a test string [more or less]";
var matched = regex.exec(strToMatch);

它将返回:

["[more or less]", "more or less"]

你需要的是第二个值。使用:

var matched = regex.exec(strToMatch)[1];

返回:

"more or less"

[^\[]匹配任何不是[的字符。

+匹配1个或更多不是[的东西。创建这些匹配项的组。

(?=\])正面展望]。匹配以]结尾的组,但不将其包含在结果中。

完成了。

[^\[]+(?=\])

证明。

http://regexr.com/3gobr

类似于由null提出的解决方案。但额外的\]是不需要的。另外需要注意的是,\似乎不需要转义^后面的[。为了可读性,我会保留它。

在分隔符相同的情况下不起作用。例如“more or less”。

如果需要提取不带括号的文本,可以使用bash awk

echo[你好mundo”|啊- f”[][]{打印2美元的”

结果:

你好世界

下面是我在c#中没有'['和']'的原因:

var text = "This is a test string [more or less]";

// Getting only string between '[' and ']'
Regex regex = new Regex(@"\[(.+?)\]");
var matchGroups = regex.Matches(text);

for (int i = 0; i < matchGroups.Count; i++)
{
    Console.WriteLine(matchGroups[i].Groups[1]);
}

输出结果为:

more or less