zoukankan      html  css  js  c++  java
  • 词频统计项目的总结

           刚开始在做词频统计时只能在代码中更改统计的段落,这样使代码看起来非常的乱而且容易出错,随着老师的要求有变更,我的代码也开始进行更新,词频统计实现可以从控制台进行输入要统计文档的名字进行统计,实现统计所有词频数目以及按词频的数量从大到小的顺序进行排序。直到现在可以将原本控制台工程迁移到了web工程上

    词频统计现在具有以下的特点: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件; 2.在页面上给出链接 (如果有封皮、作者、字数、页数等信息更佳)或表格,展示经典英文小说词频统计结果;3. 用柱状图进行数据展示。4. 图表上只显示文件名、总次数、排序后的前30个单词。 5.不能识别“it's,I'm,he's”这样的连词。

    在词频统计的时候可以实现以下的功能:   1. 上传文档。 可以选择文档的路径然后上传直接文档。2. 统计所有单词数目。 3. 统计文档的总行数。4. 统计文档中相邻两个单词出现的次数。5. 按词频的数量从大 到小进行排序。 6. 图表显示数据。

            一点一点的需求变更,使我的词频统计也越来的越完善,词频统计让我重新复习了文件、文件输出流、字符流以及集合类等相关知识,代码能力也有进步。做项目的过程还是挺辛苦的。

  • 相关阅读:
    codeforces 55d记忆化搜索
    codeforces 698b 图论
    codeforces 716d 图论加二分
    求多边形面积模板***
    hdu 5869 区间gcd的求法及应用
    codeforces 589a(构造的字符串后,最后要加终止符,,,)
    凸包模板***
    2014ACM-ICPC 西安赛区总结
    Codeforces 475D CGCDSSQ(分治)
    Acdream1217 Cracking' RSA(高斯消元)
  • 原文地址:https://www.cnblogs.com/linliaimeili/p/6042809.html
Copyright © 2011-2022 走看看