zoukankan      html  css  js  c++  java
  • 【个人开发】词频统计-文档设计

    项目设计

    一、需求分析

    (1)    输入输出

    1. 命令行参数输入——文件夹或文件(自动判断)

    2. result.txt形式输出——各项数据结果(如图)

    (2)    功能模块

    1. 文件字符数统计模块

    2. 文件单词数统计模块

    3. 文件行数统计模块

    4. 文件单词与词组频数统计模块:单词频数统计 + 词组频数统计

    二、设计实现

    (1)    模块a

        if语句判断字符(包括空格、水平制表符和换行符),累加

    (2)    模块b

        利用单词特征(分隔符分割,至少四个字母开头)判断

    (3)    模块c

        累计换行符或一行一行读

    (4)    模块d

        大量查找与插入,使用哈希表存储单词和词组,归并法排序

    (5)    输入:

        采用_finddata_t结构体(待调研)

    (6)    输出:

        调用文件函数,用源码生成txt文档,并写入

     

    三、任务分配与时间安排

    status

    stages

    预估耗时

    Accept

    Planning

    40

    Accept

            --Estimate

    40

    Accept

    Development

    720

    Accept

            --Analysis

    30

    Accept

            --Design spec

    60

    Accept

            --Design review

    10

    Accept

            --Coding stantard

    10

    Accept

            --Design

    120

    Accept

            --Coding

    360

    Accept

            --Coding review

    90

    Accept

            --Test

    40

    Accept

    Record time spent

    10

    Accept

    Test Report

    90

    Accept

    Size Measurement

    10

    Accept

    Postmortem

    30

    Accept

    Summary

    900

  • 相关阅读:
    014 要区分好slice,splice和split,方法如下
    108 shutil模块(了解)
    107 pathlib模块(了解)
    106 collections模块
    105 typing模块
    104 re模块
    103_01 matplotlib模块
    102 pandas模块
    101 numpy模块
    SQLserver找出执行慢的SQL语句
  • 原文地址:https://www.cnblogs.com/chenzhikai/p/8627243.html
Copyright © 2011-2022 走看看