- 个人介绍
- 姓名:张家林
- 学号:2018*****7266
- 方向:JavaWeb一组
- 码云主页:https://gitee.com/FengLingxuan
- 本次项目地址:https://gitee.com/FengLingxuan/level-18-personal-project
- PSP流程管理
计划及开发阶段
阶段 预计时间 时间 作业要求分析 10分钟 30分钟 任务规划 30分钟 30分钟 步骤零实现 35分钟 20分钟 步骤一实现 40分钟 25分钟 步骤二实现 15分钟 5分钟 步骤三实现 40分钟 未完成 步骤四实现 30分钟 未完成 - 程序设计思路
- 步骤零 输出某个英文文本文件中 26 字母出现的频率,由高到低排列
- 使用IO流从文件中读取文件内容
- 使用正则表达式替换非A-Z、a-z的内容
- 将替换后的结果转换为char类型数组
- 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
- 对key的结果进行处理(取百分比、排序)
- 输出结果
- 步骤一 输出单个文件中的前 N 个最常出现的英语单词。
- 输出不重复的单词,按照出现次数排列
- 使用正则表达式对读取的内容进行处理(条件:非字母数字)
- 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
- 对key的结果进行处理(排序)
- 返回结果
- 指定文件目录,对目录下每一个文件执行 wf.exe -f
的操作。 - 获得目录下文件列表
- 如果是文件,执行-f操作,如果是目录,根据是否携带迭代标识处理,如果携带迭代标识,调用自身方法,对本目录下的所有内容递归处理
- 返回结果
- 支持 -n 参数,输出出现次数最多的前 n 个单词
- 在输出时,判断是否存在-n参数,如果存在,则根据-n指定的单词数量进行控制
- 输出不重复的单词,按照出现次数排列
- 步骤2 支持stop words
- 在统计词频时,判断是否存在停词表参数
- 存在停词表参数时,读取停词表文件
- 对停词表文件进行处理,得到List
- 在处理词频时,判断其是否在停词表内,如果存在,跳过单次循环
- 步骤零 输出某个英文文本文件中 26 字母出现的频率,由高到低排列
- 单元测试思路
- 对于步骤零的测试思路
- 不携带文件对象
- 携带错误文件对象(不存在)
- 携带错误文件对象(为目录)
- 携带正确文件对象
- 对于步骤零的测试思路
- 效能分析报告