多年来,我慢慢地开发了一个正则表达式,它可以正确验证大多数电子邮件地址,假设它们不使用IP地址作为服务器部分。
我在几个PHP程序中使用它,而且大多数时候都可以使用。然而,不时有人与我联系,他们对使用它的网站有问题,我最终不得不做出一些调整(最近我意识到我不允许四个字符的TLD)。
你有或见过验证电子邮件的最佳正则表达式是什么?
我见过几种使用函数的解决方案,这些函数使用了几个较短的表达式,但我宁愿在简单函数中使用一个长的复杂表达式,而不是在更复杂的函数中使用几个短表达式。
多年来,我慢慢地开发了一个正则表达式,它可以正确验证大多数电子邮件地址,假设它们不使用IP地址作为服务器部分。
我在几个PHP程序中使用它,而且大多数时候都可以使用。然而,不时有人与我联系,他们对使用它的网站有问题,我最终不得不做出一些调整(最近我意识到我不允许四个字符的TLD)。
你有或见过验证电子邮件的最佳正则表达式是什么?
我见过几种使用函数的解决方案,这些函数使用了几个较短的表达式,但我宁愿在简单函数中使用一个长的复杂表达式,而不是在更复杂的函数中使用几个短表达式。
当前回答
我使用多步骤验证。由于没有任何完美的方法来验证电子邮件地址,因此无法创建完美的电子邮件地址,但至少您可以通知用户他/她做错了什么-以下是我的方法:
我首先使用非常基本的正则表达式进行验证,它只检查电子邮件是否只包含一个@符号,并且在该符号之前或之后不为空。例如/^[^@\s]+@[^@\s]+$/如果第一个验证器没有通过(对于大多数地址来说,它应该通过,尽管它不是完美的),那么警告用户电子邮件无效,不允许他/她继续输入如果通过,则使用更严格的正则表达式进行验证,这可能会禁止有效的电子邮件。如果未通过,将警告用户可能发生错误,但允许用户继续。与步骤(1)不同,因为这是一个明显的错误,所以不允许用户继续。
换言之,第一次自由验证只是去除明显的错误,它被视为“错误”。人们键入了空白地址、没有@符号的地址等等。这应该被视为错误。第二个更严格,但它被视为“警告”,用户可以继续输入,但至少要检查他/她是否输入了有效的条目。这里的关键在于错误/警告方法——错误是在99.99%的情况下不能成为有效电子邮件的东西。
当然,您可以调整使第一个正则表达式更自由和第二个正则表达式更加严格的因素。
根据您的需要,上述方法可能适用于您。
其他回答
为了使用JavaScript验证电子邮件地址,使用此功能更方便和高效(根据W3Schools):
function validateEmail()
{
var x = document.f.email.value;
var atpos = x.indexOf("@");
var dotpos = x.lastIndexOf(".");
if (atpos < 1 || dotpos < atpos+2 || dotpos+2 >= x.length)
{
alert("Not a valid e-mail address");
return false;
}
}
我用它,它很完美。
问题标题相当通用,但是问题的主体表明它是关于基于PHP的解决方案的。将尝试解决这两个问题。
一般来说,对于所有编程语言:典型的验证“带有reg ex的电子邮件地址是任何基于互联网的服务提供商都应该避免的事情。域名和电子邮件地址种类的可能性已经大大增加,任何验证尝试都可能会导致拒绝某些有效用户进入您的系统。为了避免这种情况,最好的方法之一是向用户发送电子邮件确认它被接收。“普遍接受指导小组”的好朋友们编制了一份按语言排列的库列表,发现这些库符合/不符合与国际化域名和国际化电子邮件地址相关的各种参数。请在这里和这里找到这些文档的链接。
具体来说PHP:
PHP中有一个很好的库,即EmailValidator。它是一个电子邮件地址验证器,包括许多验证方法,如DNS验证。特别推荐的验证器称为RFCValidator,并根据多个RFC验证电子邮件地址。它在包容IDN和国际化电子邮件地址方面具有良好的合规性。
我也有类似的愿望:希望快速检查电子邮件地址中的语法,而不要过分使用电子邮件发送实用程序(邮件::RFC822::地址答案显然是正确的答案)。我同意这个(我是一个POSIX正则表达式的人,所以我通常不会使用PCRE中的\d等,因为它们让我看不清楚):
preg_match("_^[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*@[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?)*\$_", $adr)
这是RFC正确的,但它明确排除了过时的表单以及直接IP地址(IP地址和传统IP地址),而该实用程序的目标组中的某些人(主要是:在IRC上的#sendmail中打扰我们的人)通常不希望或不需要这些地址。
IDN(国际化域名)明确不在电子邮件范围内:地址如“foo@cäcilenchor bonn.de“必须写”foo@xn--ccilienchor-bonn-vnb.de而在网络上(这包括HTML中的mailto:links和这样的乐趣),只允许GUI向用户显示(并接受然后转换)这样的名称。
根据RFC 2821和RFC 2822,电子邮件地址的本地部分可以使用以下任意ASCII字符:
大写和小写字母数字0到9字符!#$%&'*+-/=^_`{|}~字符“.”,前提是它不是本地部分中的第一个或最后一个字符。
比赛:
一个&d@somedomain.com一个*d@somedomain.com一个/d@somedomain.com
不匹配项:
.abc@somedomain.comabc.@somedomain.coma>b@somedomain.com
对于符合RFC 2821和2822的,可以使用:
^((([!#$%&'*+\-/=?^_`{|}~\w])|([!#$%&'*+\-/=?^_`{|}~\w][!#$%&'*+\-/=?^_`{|}~\.\w]{0,}[!#$%&'*+\-/=?^_`{|}~\w]))[@]\w+([-.]\w+)*\.\w+([-.]\w+)*)$
电子邮件-符合RFC 2821、2822
也许是最好的:
/^[a-zA-Z0-9]+([-._][a-zA-Z0-9]+)*@[a-zA-Z0-9]+([-.][a-zA-Z0-9]+)*\.[a-zA-Z]{2,7}$/
以字母或数字开头。它可能包括“-__”,以“.”结尾,并且少于七个字符(例如.company)。