| 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879 |
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879 |
| 这个作业的目标 | 学会使用Github并且统计编程 |
| 学号 | 20188496 |
| 其他参考文献 | 《构建之法》 |
gitub地址
https://github.com/leslie8496
PSP表格
| PSP2.1 | Personal Software Process Stages | 预估耗时(小时) | 实际耗时(小时) |
|---|---|---|---|
| Planning | 计划 | 1 | 1 |
| • Estimate | • 估计这个任务需要多少时间 | 5 | 10 |
| Development | 开发 | 5 | 10 |
| • Analysis | • 需求分析 (包括学习新技术) | 0.5 | 1 |
| • Design Spec | • 生成设计文档 | 1 | 2 |
| • Design Review | • 设计复审 | 1 | 2 |
| • Coding Standard | • 代码规范 (为目前的开发制定合适的规范) | 1 | 1 |
| • Design | • 具体设计 | 2 | 4 |
| • Coding | • 具体编码 | 5 | 5 |
| • Code Review | • 代码复审 | 0.5 | 0.5 |
| • Test | • 测试(自我测试,修改代码,提交修改) | 1 | 0.5 |
| Reporting | 报告 | 2 | 4 |
| • Test Repor | • 测试报告 | 2 | 3 |
| • Size Measurement | • 计算工作量 | 1 | 2 |
| • Postmortem & Process Improvement Plan | • 事后总结, 并提出过程改进计划 | 2 | 2 |
| 合计 | 30 | 40 |
解题思路
由需求可知,需要设计的功能要有:读取文件,统计单词,筛选出无意义的词语,排序,展示结果。
可用inputStream 进行读取,用bufferedReader进行包装,用JAVA中的StringTokenizer工具进行分词。
Map集合的key-value键值对容器装取分出的词,key代表单词,value为单词出现的次数。
在装的同时,筛选出无意义的词语。
最后用Array,按照value的值的大小进行排序。
其中map遍历算法参考csdn.
关键算法流程图

运行结果

主要代码:
添加筛选,将无效词汇去除

对集合根据Value值排序

遍历Map.Entry

心得
关于作业要求格式以及github,这是一个不同于往常的挑战,挑战失败。
关于词频统计,我发现树的一些应用也可行,以后再继续对其深究。