zoukankan      html  css  js  c++  java
  • 软件工程个人作业——词频统计

    项目概况

    对源文件(*.txt,*.cpp,*.h,*.cs,*.html,*.js,*.java,*.py,*.php等,文件夹内的所有文件)统计字符数、单词数、行数、词频,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处理多个文件。

    具体要求

    1. 统计文件的字符数(只需要统计Ascii码,汉字不用考虑,换行符不用考虑,'\0'不用考虑)(ascii码大小在[32,126]之间)

    2. 统计文件的单词总数

    3. 统计文件的总行数(任何字符构成的行,都需要统计)(不要只看换行符的数量,要小心最后一行没有换行符的情形)(空行算一行)

    4. 统计文件中各单词的出现次数,输出频率最高的10个。

    5. 对给定文件夹及其递归子文件夹下的所有文件进行统计

    6. 统计两个单词(词组)在一起的频率,输出频率最高的前10个。

    7. 在Linux系统下,进行性能分析,过程写到blog中(附加题) 

    psp表格

    目前进度及安排

    完成了基本规划,对项目的难点及解决有了大致的了解。预计今天完成1、2、3、4,明天完成5、6,周三进行调试

    语言

    C

  • 相关阅读:
    Kth element of Two Sorted Arrays
    Populating Next Right Pointers in Each Node I && II
    Average waiting time of SJF and Round Robin scheduling
    LRU Cache
    Calculate H-index
    Get Level of a node in a Binary Tree
    Two Sum
    Intersection of Two Linked Lists
    Symmetric Tree
    Lowest Common Ancestor of Binary (Search) Tree
  • 原文地址:https://www.cnblogs.com/ustcccj/p/8652291.html
Copyright © 2011-2022 走看看