我试图使用正则表达式来匹配空格分隔的数字。 我找不到\b(“单词边界”)的精确定义。 我假设-12将是一个“整数词”(与\b\-?\d+\b匹配),但这似乎不起作用。如果能知道方法,我将不胜感激。

[我在Java 1.6中使用Java正则表达式]

例子:

Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");
String plus = " 12 ";
System.out.println(""+pattern.matcher(plus).matches());

String minus = " -12 ";
System.out.println(""+pattern.matcher(minus).matches());

pattern = Pattern.compile("\\s*\\-?\\d+\\s*");
System.out.println(""+pattern.matcher(minus).matches());

这将返回:

true
false
true

当前回答

我相信你的问题是由于一个事实-不是一个字字符。因此,单词boundary将在-之后匹配,因此不会捕获它。单词边界匹配字符串中第一个单词字符之前和最后一个单词字符之后,以及在它之前是单词字符或非单词字符,在它之后是相反的任何位置。还要注意,单词边界是零宽度匹配。

一个可能的选择是

(?:(?:^|\s)-?)\d+\b

这将匹配以空格字符和可选破折号开始,并以单词边界结束的任何数字。它还将匹配从字符串开头开始的数字。

其他回答

在学习正则表达式的过程中,我真的被\b这个元字符困住了。当我反复地问自己“它是什么,它是什么”时,我确实没有理解它的意思。在使用这个网站做了一些尝试之后,我注意到了每个单词开头和单词结尾的粉色垂直破折号。当时我很好地理解了它的意思。现在正好是word(\w)-boundary。

我的观点仅仅是以理解为导向的。其背后的逻辑应该从另一个答案来考察。

我认为它是最后一个匹配或字符串的开始或结束的边界(即字符跟随)。

我相信你的问题是由于一个事实-不是一个字字符。因此,单词boundary将在-之后匹配,因此不会捕获它。单词边界匹配字符串中第一个单词字符之前和最后一个单词字符之后,以及在它之前是单词字符或非单词字符,在它之后是相反的任何位置。还要注意,单词边界是零宽度匹配。

一个可能的选择是

(?:(?:^|\s)-?)\d+\b

这将匹配以空格字符和可选破折号开始,并以单词边界结束的任何数字。它还将匹配从字符串开头开始的数字。

查看关于边界条件的文档:

http://java.sun.com/docs/books/tutorial/essential/regex/bounds.html

看看这个例子:

public static void main(final String[] args)
    {
        String x = "I found the value -12 in my string.";
        System.err.println(Arrays.toString(x.split("\\b-?\\d+\\b")));
    }

当你把它打印出来时,注意输出是这样的:

[我发现值-,在我的字符串。]

这意味着“-”字符不会因为位于单词的边界而被拾取,因为它不被认为是单词字符。看来@brianary比我先下手为强,所以他得到了支持。

单词边界可以出现在以下三个位置之一:

如果第一个字符是单词字符,则在字符串的第一个字符之前。 如果最后一个字符是单词字符,则在字符串的最后一个字符之后。 在字符串中的两个字符之间,其中一个是单词字符,另一个不是单词字符。

单词字符是字母-数字;负号不是。 摘自正则表达式教程。