我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C++语言实现一下电子邮件地址验证程序,用的是C++ 11标准新增加的STL正则表达式。
源代码如下,该代码已在Visual Studio 2010上验证通过。g++ 4.6不支持C++ 11的STL正则表达式,g++ 4.6上编译可以通过,但运行时错误,抛出regex_error异常。因此,如果要在g++ 4.6上使用正则表达式,请用GNU正则表达式库或者用boost正则表达式库。
/* * regex.cpp - 用正则表达式验证电子邮件地址 * * C++11标准 STL正则表达式 * * * Copyright 叶剑飞 2012 * * 编译命令: * cl regex.cpp /EHsc /link /out:regex.exe * */ #include <iostream> #include <cstdlib> #include <string> #include <regex> // regular expression 正则表达式 using namespace std; int main ( ) { string email_address; string user_name, domain_name; regex pattern("([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)"); // 正则表达式,匹配规则: // 第1组(即用户名),匹配规则:0至9、A至Z、a至z、下划线、点、连字符之中 // 的任意字符,重复一遍或以上 // 中间,一个“@”符号 // 第二组(即域名),匹配规则:0至9或a至z之中的任意字符重复一遍或以上, // 接着一个点,接着a至z之中的任意字符重复2至3遍(如com或cn等), // 第二组内部的一组,一个点,接着a至z之中的任意字符重复2遍(如cn或fr等) // 内部一整组重复零次或一次 // 输入文件结尾符(Windows用Ctrl+Z,UNIX用Ctrl+D)结束循环 while ( cin >> email_address ) { if ( regex_match( email_address, pattern ) ) { cout << "您输入的电子邮件地址合法" << endl; // 截取第一组 user_name = regex_replace( email_address, pattern, string("$1") ); // 截取第二组 domain_name = regex_replace( email_address, pattern, string("$2") ); cout << "用户名:" << user_name << endl; cout << "域名:" << domain_name << endl; cout << endl; } else { cout << "您输入的电子邮件地址不合法" << endl << endl; } } return EXIT_SUCCESS; }