PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
· Planning | · 计划 | 60 | 30 |
· Estimate | · 估计这个任务需要多少时间 | 10 | 10 |
· Development | · 开发 | 180 | 300 |
· Analysis | · 需求分析 (包括学习新技术) | 80 | 50 |
· Design Spec | · 生成设计文档 | 90 | 60 |
· Design Review | · 设计复审 | 90 | 60 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 30 | 10 |
· Design | · 具体设计 | 60 | 60 |
· Coding | · 具体编码 | 180 | 180 |
· Code Review | · 代码复审 | 90 | 180 |
· Test | · 测试(自我测试,修改代码,提交修改) | 120 | 480 |
· Reporting Standard | · 报告 | 60 | 60 |
· Test Repor | · 测试报告 | 60 | 60 |
· Size Measurement | · 计算工作量 | 20 | 20 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 60 | 60 |
· | · 合计 | 1190 | 1620 |
解题思路
- 由于数据只有手机号被混到地址中,所以先切出手机号
- 然后切除名字方便解析地址
- 地址解析部分用正则表达式
- 解析用到的正则表达式参考博客[1]
关键代码
String regex="(?<province>[^省]+自治区|.*?省|.*?行政区|.*?市)(?<city>[^市]+自治州|.*?地区|.*?行政单位|.+盟|市辖区|.*?市|.*?县)(?<county>[^县]+县|.+区|.+市|.+旗|.+海域|.+岛)?(?<town>[^区]+区|.+镇)?(?<village>.*)";
输入输出样例
//传入参数
System.out.println(AddressUtil.addressResolutionVersion1("李四,福建省福州13756899511市鼓楼区鼓西街道湖滨路110号湖滨大厦一层"));
System.out.println(AddressUtil.addressResolutionVersion1("张三,福建省福州市闽13599622362侯县上街镇福州大学10#111"));
System.out.println(AddressUtil.addressResolutionVersion1("王五,福建省福州市鼓楼18960221533区123号福州鼓楼医院"));
System.out.println(AddressUtil.addressResolutionVersion1("小美,北京市东15822153326城区交道口东大街1号北京市东城区人民法院"));
System.out.println(AddressUtil.addressResolutionVersion1("小陈,广东省东莞市凤岗13965231525镇凤平路13号"));
//控制台打印结果
{"姓名":"李四","手机":"13756899511","地址":["福建省","福州市","鼓楼区","","鼓西街道湖滨路110号湖滨大厦一层"]}
{"姓名":"张三","手机":"13599622362","地址":["福建省","福州市","闽侯县","上街镇","福州大学10#111"]}
{"姓名":"王五","手机":"18960221533","地址":["福建省","福州市","鼓楼区","","123号福州鼓楼医院"]}
{"姓名":"小美","手机":"15822153326","地址":["北京市","东城区交道口东大街1号北京市","东城区","","人民法院"]}
{"姓名":"小陈","手机":"13965231525","地址":["广东省","东莞市","","凤岗镇","凤平路13号"]}
发现和范例给的要求还是有区别的
分析问题
- 直辖市和一般城市没有做区别
- town部分没有匹配街道
- 没有采用"非贪婪"的表达式
修改后的正则表达式
String regex="(?<province>[^省]+自治区|.*?省|.*?行政区)?(?<city>[^市]+自治州|.*?地区|.*?行政单位|.+盟|市辖区|.*?市|.*?县)?(?<county>[^县]+县|.+?区|.+市|.+旗|.+海域|.+岛)?(?<town>[^区]+区|.+镇|.+街道)?(?<village>.*)";
后来在测试过程中发现测试数据存在省市区关键字缺失的情况,因此不能采用上面的方法。我裂开了
修正后的思路
- 手机号,名字的处理方法不变
- 加载行政区数据匹配字符串的前3级
- 从最前的字符遍历的输入字符,与数据中的行政区一一比较
- 后面的级别同样通过正则表达式
主要类和方法
类名 | 方法名 | 功能 |
---|---|---|
AreaCodeConvert | void Convert() | 读取行政区数据文件加载到内存中 |
AddressUtil | void addressResolutionVersion2(String address) | 解析地址(V1已经废弃) |
- | String getProvince(String address) | 解析省级 |
- | String getCity(String address) | 解析市级 |
- | String getCityWithoutProvince(String address) | 省缺失解析市级 |
- | String getCounty(String address) | 解析县级 |
- | String getCountyWithoutProvinceAndCity(String address) | 省市缺失解析县级 |
- | String getCountyWithoutCity(String address) | 市缺失解析县级 |
行政区数据来源
http://www.mca.gov.cn/article/sj/xzqh/2019/201908/201908271607.html
通过观察得到各级地区后缀名为
-
一级
- 省
- 市
- 自治区
- 特别行政区
-
二级
- 市
- 自治州
- 地区
- 盟
-
三级
- 区
- 市
- 旗
- 海域
- 岛
- 县
正则表达式
//5级的后2级
(?<town>[^区]+?区|.+?镇|.+?街道|.+?乡)?(?<village>.*)
//7级的后4级
(?<town>[^区]+区|.+?镇|.+?街道|.+?乡)?(?<village1>.+?街|.+?路|.+?巷)?(?<village2>[d]+?号|[d]+.?道)?(?<village3>.*)
性能分析图
耗时主要花在2部分1个是读取数据耗时,这个基本没得改,另一个是输入的地址和数据中的地址做匹配,尽量优化匹配的效率。
单元测试
测试用例
1!李四,福建鼓楼13756899511鼓西街道湖滨路110号湖滨大厦一层.
1!张三,福州市闽13599622362侯县上街镇福州大学10#111.
1!刘湖,吉林省白山市六道江镇西村药店18694520738.
1!王五,腾冲市满邑社区华园三小区47号18694520738.
1!咸陡隐,江苏省苏州市吴江13184142847区平望镇新业织造有限公司吴江区平望镇双浜村村民委员会.
2!王五,福建省福州市鼓楼18960221533区五一北路123号福州鼓楼医院.
2!小美,北京市东15822153326城区交道口东大街1号北京市东城区人民法院.
2!王五,云南省昭通市水富18694520738县云川路1号.
2!王五,云南省迪庆藏族自治州18694520738香格里拉市.
2!王五,四川省眉山市仁寿18694520738县黑龙滩镇牌坊街.
2!王五,陕西省渭南市韩18694520738城市108国道附近.
{"姓名":"李四","手机":"13756899511","地址":["福建省","","鼓楼区","鼓西街道","湖滨路110号湖滨大厦一层"]}
{"姓名":"张三","手机":"13599622362","地址":["","福州市","闽侯县","上街镇","福州大学10#111"]}
{"姓名":"刘湖","手机":"18694520738","地址":["吉林省","白山市","","六道江镇","西村药店"]}
{"姓名":"王五","手机":"18694520738","地址":["","","腾冲市","满邑社区","华园三小区47号"]}
{"姓名":"咸陡隐","手机":"13184142847","地址":["江苏省","苏州市","吴江区","平望镇","新业织造有限公司吴江区平望镇双浜村村民委员会"]}
{"姓名":"王五","手机":"18960221533","地址":["福建省","福州市","鼓楼区","","五一北路","123号","福州鼓楼医院"]}
{"姓名":"小美","手机":"15822153326","地址":["北京","北京市","东城区","","交道口东大街","1号","北京市东城区人民法院"]}
{"姓名":"王五","手机":"18694520738","地址":["云南省","昭通市","水富市","","云川路","1号",""]}
{"姓名":"王五","手机":"18694520738","地址":["云南省","迪庆藏族自治州","香格里拉市","","","",""]}
{"姓名":"王五","手机":"18694520738","地址":["四川省","眉山市","仁寿县","黑龙滩镇","牌坊街","",""]}
{"姓名":"王五","手机":"18694520738","地址":["陕西省","渭南市","韩城市","","","108国道","附近"]}
测试覆盖率
异常处理
- 只有手机号没有地址
- 2!王五,18694520738
- 没有选择难度
- 王五,陕西省渭南市韩18694520738城市108国道附近.
小总结和心路历程
- 第一次了解国家各个行政区原来分这么多种
- 测试真的给我做吐了
- 算法无力,代码辣鸡,写个作业都费劲
- 为什么测试这么麻烦的?
- 中秋还要上课撸代码太惨了吧??
- 来个大佬带带我(无能狂怒)