Email地址有效性的检验是一个经常遇到的问题啦!一般的检验方法是对Email地址字符串进行简单的格式检验,如是否含有@ .等有效字符等。这种方法只能保证该地址从格式上看似有效,并不能保证地址可达。最近进行大量的地址校验,写了一个小程序,可以检测Email地址是否真 正可达。
Email地址包括两个部分:用户名和邮件服务器。因此,检验邮件地址可以分为两步进行:首先检验邮件服务器,然后检验用户名。如 abc@163.com,首先检验163.com服务器是否是有效的邮件服务器,如果是再在该服务器上确认是否存在abc用户。
通过查询DNS服务器,获取域名的MX(Mail Exchanger)记录,可以确定某一域名对应的邮件服务器是否有效。在Windows系统中,可以使用nslookup程序来查看这一记录。
//通过nslookup程序查询MX记录,获取域名对应的mail服务器
public string getMailServer(string strEmail) { string strDomain = strEmail.Split('@')[1]; ProcessStartInfo info = new ProcessStartInfo(); info.UseShellExecute = false; info.RedirectStandardInput = true; info.RedirectStandardOutput = true; info.FileName = "nslookup"; info.CreateNoWindow = true; info.Arguments = "-type=mx " + strDomain; Process ns = Process.Start(info); StreamReader sout = ns.StandardOutput; Regex reg = new Regex("mail exchanger = (?<mailServer>[^\\s].*)"); string strResponse = ""; while ((strResponse = sout.ReadLine()) != null) { Match amatch = reg.Match(strResponse); if (reg.Match(strResponse).Success) return amatch.Groups["mailServer"].Value; } return null; }
第二步,连接邮件服务器,确认服务器的可用性和用户是否存在
public int checkEmail(string mailAddress,out string errorInfo) { Regex reg = new Regex("^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\\.[a-zA-Z0-9_-]+)+$"); if (!reg.IsMatch(mailAddress)) { errorInfo = "Email Format error!"; return 405; } string mailServer = getMailServer(mailAddress); if (mailServer == null) { errorInfo = "Email Server error!"; return 404; } TcpClient tcpc = new TcpClient(); tcpc.NoDelay = true; tcpc.ReceiveTimeout = 3000; tcpc.SendTimeout = 3000; try { tcpc.Connect(mailServer, 25); NetworkStream s = tcpc.GetStream(); StreamReader sr = new StreamReader(s, Encoding.Default); StreamWriter sw = new StreamWriter(s, Encoding.Default); string strResponse = ""; string strTestFrom = mailAddress; sw.WriteLine("helo " + mailServer); sw.WriteLine("mail from:<" + mailAddress + ">"); sw.WriteLine("rcpt to:<" + strTestFrom + ">"); strResponse = sr.ReadLine(); if (!strResponse.StartsWith("2")) { errorInfo = "UserName error!"; return 403; } sw.WriteLine("quit"); errorInfo = String.Empty; return 200; } catch (Exception ee) { errorInfo = ee.Message.ToString(); return 403; } }
程序的调用方法:
if (checkEmail("abc@163.com", out errorInfo) == 200) { return true; }
这个程序是根据SMTP的基本过程实现的。与一个mail服务器连接发邮件的基本过程可能是这样的:
telnet mail.brookes.com 25
>>220 brookes.com<IMail 8.02>
HELO
>>250 mail.brookes.com
MAIL FROM:brookes@tsinghua.org.cn
>>250 Ok
RCPT TO:me@brookes.com
>>250 ok its for me@brookes.com
DATA
>>ok.send it ;end with <CRLF>.<CRLF>
soem data.
>>250 message queued
QUIT
>>221 Goodbye.
灰色部分代码是一个常规的Email地址检查方法,检查地址形式上的有效性。
程序用到了System.IO,System.Net.Sockets,System.Diagnostics命名空间,通过checkMail(mailAddress)调用。
说明:
1.这种方法可以进一步检查Email地址的有效性,比只从形式上验证有了很大的进步。对于需要通过Email地址进行注册信息验证、发送密码等应用,可以更进一步保证有效;
2.由于Email服务器的多样和可配置性,因此次程序并不能保证结果的普遍适用;
3.对于一些大的邮件服务器,通常具有较强的反垃圾邮件功能,对于此类探测可能会作出反应,因此不适合于大量的地址探测。比如,我在探测过程中就发现了163.com服务器停止对次进行响应。