zoukankan      html  css  js  c++  java
  • 2-1 编程作业

    这个作业属于哪个课程 https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879
    这个作业要求在哪里 https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879
    这个作业的目标 学会使用Github并且统计编程
    学号 20188496
    其他参考文献 《构建之法》

    gitub地址

    https://github.com/leslie8496

    PSP表格

    PSP2.1Personal Software Process Stages预估耗时(小时)实际耗时(小时)
    Planning 计划 1 1
    • Estimate • 估计这个任务需要多少时间 5 10
    Development 开发 5 10
    • Analysis • 需求分析 (包括学习新技术) 0.5 1
    • Design Spec • 生成设计文档 1 2
    • Design Review • 设计复审 1 2
    • Coding Standard • 代码规范 (为目前的开发制定合适的规范) 1 1
    • Design • 具体设计 2 4
    • Coding • 具体编码 5 5
    • Code Review • 代码复审 0.5 0.5
    • Test • 测试(自我测试,修改代码,提交修改) 1 0.5
    Reporting 报告 2 4
    • Test Repor • 测试报告 2 3
    • Size Measurement • 计算工作量 1 2
    • Postmortem & Process Improvement Plan • 事后总结, 并提出过程改进计划 2 2
    合计   30 40

    解题思路

    由需求可知,需要设计的功能要有:读取文件,统计单词,筛选出无意义的词语,排序,展示结果。

    可用inputStream 进行读取,用bufferedReader进行包装,用JAVA中的StringTokenizer工具进行分词。

    Map集合的key-value键值对容器装取分出的词,key代表单词,value为单词出现的次数。

    在装的同时,筛选出无意义的词语。

    最后用Array,按照value的值的大小进行排序。

    其中map遍历算法参考csdn.

    关键算法流程图

    运行结果

    主要代码:

    添加筛选,将无效词汇去除

     对集合根据Value值排序

     遍历Map.Entry

    心得

    关于作业要求格式以及github,这是一个不同于往常的挑战,挑战失败。

    关于词频统计,我发现树的一些应用也可行,以后再继续对其深究。

  • 相关阅读:
    Django组件——forms组件
    Django组件——分页器(paginator)
    Django和Ajax
    多表操作
    输入DStream和Receiver详解
    spark中streamingContext的使用详解
    spark与storm的对比
    spark1.5引进内置函数
    spark 分析sql内容再插入到sql表中
    spark之数据源之自动分区推断
  • 原文地址:https://www.cnblogs.com/hn010823/p/14612201.html
Copyright © 2011-2022 走看看