使用正则表达式在文本中搜索uuid

我正在使用正则表达式在文本块中搜索uuid。目前，我依赖于所有uuid都遵循8-4-4-4-12十六进制数字模式的假设。

有人能想到这样一个用例吗?在这个用例中，这个假设是无效的，并且会导致我错过一些uuid。

当前回答

(\ w) {8} (-) (\ w) {4} {3} - [\ w]{12}在大多数情况下为我工作。

或者如果你想要真正特定[\ w] {8} - {4} (\ w) (\ w) {4} - {4} (\ w) (\ w){12}。

2010-10-22 16:45:45

其他回答

$UUID_RE = join '-', map { "[0-9a-f]{$_}" } 8, 4, 4, 4, 12;

顺便说一句，在一个位置上只允许4个只对UUIDv4有效。但是v4并不是唯一存在的UUID版本。我在实践中也遇到过v1。

2016-01-17 17:04:40

如果您想检查或验证特定的UUID版本，下面是相应的正则表达式。

注意，唯一的区别是版本号，这将在4.1.3中解释。UUID 4122 RFC的版本章节。

版本号是第三组的第一个字符:[VERSION_NUMBER][0-9A-F]{3}:

UUID v1: / ^ [0-9A-F] {8} - {4} [0-9A-F] [1] [0-9A-F] {3} - ab [89] [0-9A-F] {3} - [0-9A-F]{12} $ /我 UUID v2: / ^ [0-9A-F] {8} - {4} [0-9A-F] [2] [0-9A-F] {3} - ab [89] [0-9A-F] {3} - [0-9A-F]{12} $ /我 UUID v3: / ^ [0-9A-F] {8} - {4} [0-9A-F] [3] [0-9A-F] {3} - ab [89] [0-9A-F] {3} - [0-9A-F]{12} $ /我 UUID v4: / ^ [0-9A-F] {8} - {4} [0-9A-F] [4] [0-9A-F] {3} - ab [89] [0-9A-F] {3} - [0-9A-F]{12} $ /我 UUID v5: / ^ [0-9A-F] {8} - {4} [0-9A-F] [5] [0-9A-F] {3} - ab [89] [0-9A-F] {3} - [0-9A-F]{12} $ /我

2016-07-04 19:20:40

概括一个例子，其中下划线也被适当地忽略，只允许字母数字值，模式为8-4-4-4-12。

^ (^ \ W_] {8} (- [^ \ W_] {4}) {4} [^ \ W_] {8} $

^ (^ \ W_] {8} (- [^ \ W_] {4}) {3} - [^ \ W_] {12} $

两者都给出相同的结果，但最后一个更易于阅读。我想推荐一个可以正确学习和测试正则表达式的网站:https://regexr.com/

2022-06-10 02:47:25

所以，我认为Richard Bronosky给出了迄今为止最好的答案，但我认为你可以让它变得更简单(或至少更简洁):

re_uuid = re.compile(r'[0-9a-f]{8}(?:-[0-9a-f]{4}){3}-[0-9a-f]{12}', re.I)

2013-04-15 23:09:10

/^[0-9a-f]{8}-[0-9a-f]{4}-[1-5][0-9a-f]{3}-[89AB][0-9a-f]{3}-[0-9a-f]{12}$/i

Gajus的regexp拒绝UUID V1-3和5，尽管它们是有效的。

2014-06-24 13:19:39

使用正则表达式在文本中搜索uuid

推荐文章

最新文章

标签