如何使用正则表达式验证电子邮件地址？

多年来，我慢慢地开发了一个正则表达式，它可以正确验证大多数电子邮件地址，假设它们不使用IP地址作为服务器部分。

我在几个PHP程序中使用它，而且大多数时候都可以使用。然而，不时有人与我联系，他们对使用它的网站有问题，我最终不得不做出一些调整（最近我意识到我不允许四个字符的TLD）。

你有或见过验证电子邮件的最佳正则表达式是什么？

我见过几种使用函数的解决方案，这些函数使用了几个较短的表达式，但我宁愿在简单函数中使用一个长的复杂表达式，而不是在更复杂的函数中使用几个短表达式。

当前回答

我也有类似的愿望：希望快速检查电子邮件地址中的语法，而不要过分使用电子邮件发送实用程序（邮件：：RFC822:：地址答案显然是正确的答案）。我同意这个（我是一个POSIX正则表达式的人，所以我通常不会使用PCRE中的\d等，因为它们让我看不清楚）：

preg_match("_^[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*@[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?)*\$_", $adr)

这是RFC正确的，但它明确排除了过时的表单以及直接IP地址（IP地址和传统IP地址），而该实用程序的目标组中的某些人（主要是：在IRC上的#sendmail中打扰我们的人）通常不希望或不需要这些地址。

IDN（国际化域名）明确不在电子邮件范围内：地址如“foo@cäcilenchor bonn.de“必须写”foo@xn--ccilienchor-bonn-vnb.de而在网络上（这包括HTML中的mailto:links和这样的乐趣），只允许GUI向用户显示（并接受然后转换）这样的名称。

2013-12-05 23:58:38

其他回答

奇怪的是，您“不能”使用4个字符的TLD。您禁止人们使用.info和.name，以及长度限制stop、travel和.museum，但是的，它们比2个字符的TLD和3个字符的TLC更常见。

你也应该允许大写字母。电子邮件系统将规范本地部分和域部分。

对于域部分的正则表达式，域名不能以'-'开头，也不能以'-'结尾。Dash只能介于两者之间。

如果您使用PEAR库，请查看他们的邮件功能（我忘记了确切的名称/库）。您可以通过调用一个函数来验证电子邮件地址，它根据RFC 822中的定义验证电子邮件地址。

2008-11-06 04:48:18

没有一个是真正有用的。我在回答“是否有用于电子邮件地址验证的PHP库？”时讨论了一些问题？，它也在电子邮件地址的正则表达式识别难吗？中讨论？。

简而言之，不要期望一个可用的正则表达式能够完成正确的工作。最好的正则表达式将验证语法，而不是电子邮件的有效性(jhohn@example.com是正确的，但它可能会反弹…）。

2008-10-14 15:38:36

这是电子邮件的正则表达式之一：

^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$

2009-07-06 10:29:14

preg_match("_^[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*@[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?)*\$_", $adr)

2013-12-05 23:58:38

根据我所看到的，一个完全符合标准的正则表达式是允许的：

/^(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)(?!.{253}.+$)((?!-.*|.*-\.)([a-z0-9-]{1,63}\.)+[a-z]{2,63}|(([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9]))$/gim

演示/调试分析（交互式）

拆分：

^(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)
([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)
(?!.{253}.+$)
(
    (?!-.*|.*-\.)
    ([a-z0-9-]{1,63}\.)+
    [a-z]{2,63}
    |
    (([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}
    ([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])
)$

分析：

(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)

对以。，以一结尾，有。。或超过254个字符的最大长度

([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)

匹配一个或多个允许的字符，并应用负面外观

(?!.{253}.+$)

域名部分的负前瞻性，总共限制为253个字符

(?!-.*|.*-\.)

每个域名的负前瞻性，不允许以开头或结尾。

([a-z0-9-]{1,63}\.)+

域名中允许的字符的简单组匹配，每个字符限制为63个字符

[a-zA-Z]{2,63}

允许的顶级域的简单组匹配，该域目前仍仅限于字母，但确实包含4个字母以上的TLD。

(([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}
([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])

域名的替代方案：这将IP地址中的前3个数字与匹配。然后是IP地址中没有的第四个数字。在它背后。

2014-06-07 00:25:23

如何使用正则表达式验证电子邮件地址？

推荐文章

最新文章

标签