zoukankan      html  css  js  c++  java
  • 词频统计项目的总结

           刚开始在做词频统计时只能在代码中更改统计的段落,这样使代码看起来非常的乱而且容易出错,随着老师的要求有变更,我的代码也开始进行更新,词频统计实现可以从控制台进行输入要统计文档的名字进行统计,实现统计所有词频数目以及按词频的数量从大到小的顺序进行排序。直到现在可以将原本控制台工程迁移到了web工程上

    词频统计现在具有以下的特点: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件; 2.在页面上给出链接 (如果有封皮、作者、字数、页数等信息更佳)或表格,展示经典英文小说词频统计结果;3. 用柱状图进行数据展示。4. 图表上只显示文件名、总次数、排序后的前30个单词。 5.不能识别“it's,I'm,he's”这样的连词。

    在词频统计的时候可以实现以下的功能:   1. 上传文档。 可以选择文档的路径然后上传直接文档。2. 统计所有单词数目。 3. 统计文档的总行数。4. 统计文档中相邻两个单词出现的次数。5. 按词频的数量从大 到小进行排序。 6. 图表显示数据。

            一点一点的需求变更,使我的词频统计也越来的越完善,词频统计让我重新复习了文件、文件输出流、字符流以及集合类等相关知识,代码能力也有进步。做项目的过程还是挺辛苦的。

  • 相关阅读:
    Ecshop屏幕wap
    SQLite命令
    初识SQLite
    last_insert_id()
    php中的全局变量global(低级错误啊)
    在搜索框加入语音搜索
    解压zip文件出现bash:unzip:commond not found
    DataView.RowFilter使用
    设计自己的模板引擎(一)模板替换中的嵌套循环处理
    没完没了的Cookie,读懂asp.net,asp等web编程中的cookies 
  • 原文地址:https://www.cnblogs.com/linliaimeili/p/6042809.html
Copyright © 2011-2022 走看看