我试图使用正则表达式来匹配空格分隔的数字。 我找不到\b(“单词边界”)的精确定义。 我假设-12将是一个“整数词”(与\b\-?\d+\b匹配),但这似乎不起作用。如果能知道方法,我将不胜感激。

[我在Java 1.6中使用Java正则表达式]

例子:

Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");
String plus = " 12 ";
System.out.println(""+pattern.matcher(plus).matches());

String minus = " -12 ";
System.out.println(""+pattern.matcher(minus).matches());

pattern = Pattern.compile("\\s*\\-?\\d+\\s*");
System.out.println(""+pattern.matcher(minus).matches());

这将返回:

true
false
true

当前回答

单词边界\b用于一个单词应该是单词字符,而另一个单词应该是非单词字符。 正则表达式应为负数

--?\b\d+\b

检查工作演示

其他回答

单词边界可以出现在以下三个位置之一:

如果第一个字符是单词字符,则在字符串的第一个字符之前。 如果最后一个字符是单词字符,则在字符串的最后一个字符之后。 在字符串中的两个字符之间,其中一个是单词字符,另一个不是单词字符。

单词字符是字母-数字;负号不是。 摘自正则表达式教程。

参考:精通正则表达式(Jeffrey E.F. Friedl) - O'Reilly

\b等价于(?<!\w)(?=\w)|(?<=\w)(?!\w)

在大多数正则表达式方言中,单词边界是在\w和\w(非单词字符)之间的位置,或者在字符串的开头或结尾(分别)以单词字符([0-9A-Za-z_])开始或结束的位置。

因此,在字符串“-12”中,它将匹配在1之前或2之后。破折号不是文字字符。

我在这里讨论了b风格正则表达式的边界。

简而言之,它们是有条件的。它们的行为取决于它们旁边的东西。

# same as using a \b before:
(?(?=\w) (?<!\w)  | (?<!\W) )

# same as using a \b after:
(?(?<=\w) (?!\w)  | (?!\W)  )

有时候这并不是你想要的。详见我的另一个答案。

在学习正则表达式的过程中,我真的被\b这个元字符困住了。当我反复地问自己“它是什么,它是什么”时,我确实没有理解它的意思。在使用这个网站做了一些尝试之后,我注意到了每个单词开头和单词结尾的粉色垂直破折号。当时我很好地理解了它的意思。现在正好是word(\w)-boundary。

我的观点仅仅是以理解为导向的。其背后的逻辑应该从另一个答案来考察。