https://github.com/XINJIUXJ/sentive_words-_test/tree/main
一.PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 30 | 30 |
· Estimate | · 估计这个任务需要多少时间 | ||
Development | 开发 | 300 | 360 |
· Analysis | · 需求分析 (包括学习新技术) | 600 | 600 |
· Design Spec | · 生成设计文档 | 20 | 25 |
· Design Review | · 设计复审 | 10 | 7 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 5 | 5 |
· Design | · 具体设计 | 60 | 40 |
· Coding | · 具体编码 | 300 | 360 |
· Code Review | · 代码复审 | 120 | 120 |
· Test | · 测试(自我测试,修改代码,提交修改) | 120 | 200 |
Reporting | 报告 | 120 | 120 |
· Test Repor | · 测试报告 | 120 | 150 |
· Size Measurement | · 计算工作量 | 60 | 45 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 60 | 120 |
· 合计 | 1925 | 2182 |
二.计算机模块接口
(3.1)计算模块接口的设计与实现过程。设计包括代码如何组织,比如会有几个类,几个函数,他们之间关系如何,关键函数是否需要画出流程图?说明你的算法的关键(不必列出源代码),以及独到之处。(18')
-
思路:最开始一直都是自己在想算法,但是每一版算法都因为有各种各样的缺点或者bug最终被我pass,后面开始学习AC自动机算法,用AC自动机的思想解决问题。
-
类:
Node
:用来创建AC自动机上的结点AcAutomation
:程序的主体,其中封装了处理问题的函数 -
函数:
read_file()
负责读入org.txt和words.txt中的内容add()
负责在AC自动机中添加敏感词add_keyword()
负责读入words中的内容,并通过调用add()函数添加敏感词make_file()
为结点创建失配指针,形成trie图,构建敏感词图search()
负责查询并记录答案deal()
:负责预处理,比如将原文本大写转小写,繁体转简体等,以及负责处理答案,和写入ans.txt操作
(3.2)计算模块接口部分的性能改进。记录在改进计算模块性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(由VS 2019、JProfiler或者Jetbrains系列IDE自带的Profiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。(12')
- 由于时间不够我改进和继续完善其他功能,所以就没再对代码进一步优化。
(3.3)计算模块部分单元测试展示。展示出项目部分单元测试代码,并说明测试的函数,构造测试数据的思路。并将单元测试得到的测试覆盖率截图,发表在博客中。(12')
- 主要对search()函数和init()函数做了单元测试,起初对单元测试完全不了解,后面自己百度感觉懂得一些,自己构造了一个样例,用单元测试检测代码运行的结果是否与样例一致,经检验是一致的。
(3.4)计算模块部分异常处理说明。在博客中详细介绍每种异常的设计目标。每种异常都要选择一个单元测试样例发布在博客中,并指明错误对应的场景。(6')
- 输入异常
def io_error(path):
try:
f = open(path, 'r')
except io_error:
print('抱歉!没有找到')
exit(0)
else:
f.close()
三.心得
(4.1)在完成本次作业过程的心得体会(3')
- 这次作业完全没有规划好,导致走了不少弯路,正式开始的时候已经很晚了。
- 要学的东西还有很多,虽然极限速成了python,但感觉有的时候自己还是不会用。
- 数据结构和算法太重要了,以后会努力学习,并且多多使用python练题。
- 发现自己不适合赶ddl,越临近越慌乱,以后的作业还是要提前做好计划,尽早完成。