日期:2019.5.4
博客期:066
星期六
今天写了统计一篇文章中的单词数量,把出现最多的前几个显示出来,差不多就是这么个程序!
实现思想:
分布处理:
1、读取文件,将文件里的字符串按照换行符和空格作为分隔符的方式进行获取
2、对字符串进行去除基础标点符号的处理
3、将剩余的合法单词字符串进行库存储备,重复的数量+1,记录总数量
4、每个单词的频率也就可以算了