一、基本情况
队名:奶茶命运共同体
组长博客:https://www.cnblogs.com/pat-chou-li/p/15546527.html
小组人数:9
二、冲刺概况汇报
吴振溢:
-
过去两天完成了哪些任务
-
全国高频政策词汇排名动态轮播图组件封装。
-
展示GitHub当日代码/文档签入记录
-
-
接下来的计划
- 继续完成大数据平台的搭建,并模拟接口注入数据。
-
还剩下哪些任务
- 省级高频政策词汇动态环图
- 热点词汇频率折线图
- 财政活跃度排名柱状图
-
燃尽图
-
遇到了哪些困难
dataV中chart数据格式嵌套复杂,十分混乱。
-
有哪些收获和疑问
进一步学习了dataV的使用。
整理了数据格式并抽象,便于后续接口接入。
-
PSP & 学习进度条(学习进度条每周追加)
PSP:
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 · Estimate · 估计这个任务需要多少时间 5 5 Development 开发 · Analysis · 需求分析 (包括学习新技术) - - · Design Spec · 生成设计文档 - - · Design Review · 设计复审 - - · Coding Standard · 代码规范 (为目前的开发制定合适的规范) - - · Design · 具体设计 - - · Coding · 具体编码 140 120 · Code Review · 代码复审 10 10 · Test · 测试(自我测试,修改代码,提交修改) 10 10 Reporting 报告 · Test Repor · 测试报告 - - · Size Measurement · 计算工作量 - - · Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5 · 合计 170 150 学习进度表:
第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长 1 168 168 2.5 2.5 完成标题和财政收入排名图 2 262 430 2 4.5 完成政策总数数字翻牌器 3 215 645 2 6.5 完成全国高频政策词汇排名动态轮播图
黄朝威:
-
过去两天完成了哪些任务
-
对福建单个省文件抓取方式改进以及将文档类型正确的数据插入远端数据库。
-
对于福建省文件抓取代码注释优化方便后期维护使用。
-
分析广东省文件接口以及实现对广东省整省(包含地级市)的文件抓取
-
展示GitHub当日代码/文档签入记录
-
-
接下来的计划
- 根据广东省不同部门不同地级市的网页文档调整抓取文档内容的方式,以及解决文档编码转换异常的问题,体现在大量网页使用的编码方式不一。
-
还剩下哪些任务
- 各种省份及其部门的数据重新规范爬取。
- 对应省份的不同地级市的数据爬取。
-
燃尽图
-
遇到了哪些困难
部分省文件库需要提供关键字才能进入界面,无关键字时无法直接使用,网页编码方式不一导致部分数据为乱码数据,以及部分文件是直接以PDF文档形式出现与以往采用分析网页文本内容所在标签方式相不匹配无法直接使用原有的代码需要特殊处理,每次爬取前需要测试代码能否完整性且无误地通过,部分省(例如浙江省)抓取同一页内容时所反馈的数据可能不相同导致相同时间内爬取数据较其他省少,抓取的数据部分可能加密(
这可不敢乱来,体现在部分发文时间为一串有点规律的数字),还有个困难是马上要考试了,不能全身心投入,数模我的数模你怎么这么难。 -
有哪些收获和疑问
- 又进一步加强了
Debugger能力,进一步加强了对PyCharm各种工具的使用,以及我的评价是PyCharm的git操作真方便,和Visual Studio的git图形化操作一样便捷(准确来说是git图形化操作就便捷),进一步熟悉了如何通过网页开发者工具获取部分有用信息。 - 疑问在于相同编码条件下,控制台使用Python输出GBK字符'•'成功,使用PyCharm无法正常输出(
这就很头疼了,试图通过输出文件标题来分析爬取进度方式失败,仅能通过输出URL来分析进度条,看这一行行URL明显较麻烦·)
- 又进一步加强了
-
PSP & 学习进度条(学习进度条每周追加)
PSP:
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 5 15 · Estimate · 估计这个任务需要多少时间 5 5 Development 开发 · Analysis · 需求分析 (包括学习新技术) 20 50 · Design Spec · 生成设计文档 - - · Design Review · 设计复审 - - · Coding Standard · 代码规范 (为目前的开发制定合适的规范) 30 45 · Design · 具体设计 10 80 · Coding · 具体编码 120 240 · Code Review · 代码复审 10 10 · Test · 测试(自我测试,修改代码,提交修改) 10 120 Reporting 报告 · Test Repor · 测试报告 - - · Size Measurement · 计算工作量 5 10 · Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 50 · 合计 220 625 学习进度表:
第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长 1 325 325 12 12 成功抓取特定的数据,完成对于项目可行性的分析。 2 132 457 8 20 完善对福建单一省份的数据爬取方式,为后续其它省份提供参考代码将极大简化工作。 3 298 755 11 31 又对福建省单一省份数据抓取方式进行更新,以及推广至广东省使用。
周伟杰
-
过去俩天完成了哪些任务
- 环境的基本搭建
-
接下来的计划
- 进一步的学习
-
还剩下哪些任务
- 实现返还省份活跃度排名的接口
- 服务器部署上线
-
燃尽图
-
遇到哪些困难
- 遇到一些依赖版本冲突问题
- 对后端开发的具体流程还不太熟悉
-
有哪些收获与疑问
- 看了些类似项目的实现,对后端开发流程有了基本概念
- 零基础学习还是有点苦难
-
PSP&学习进度条
-
PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 10 10 Estimate 估计这个任务需要多少时间 10 10 Development 开发 390 410 Analysis 需求分析 &ppt&(包括学习新技术) 50 60 Design Spec 生成设计文档 - - Design Review 设计复审 - - Coding Standard 代码规范 (为目前的开发制定合适的规范) 10 20 Design 具体设计 - - Coding 具体编码 300 300 Code Review 代码复审 - - Test 测试(自我测试,修改代码,提交修改) 30 30 Reporting 报告 10 15 Test Report 测试报告 - - 100Size Measurement 计算工作量 - - Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 15 Total 合计 410 435 - 学习进度表
第N轮次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长 1 0 0 6 6 掌握了后端开发基础知识 2 0 0 5 11 了解了mybatis-plus的使用 3 500 500 6 17 环境基本搭建
-
张乐芃:
-
过去两天完成了哪些任务:
- 首页进度(100%)
- vue-scroll学习
-
接下来计划:
- 搜索模块
-
还剩下哪些任务:
- 组件封装
- api封装
- 搜索模块
- 各模块交互
- 前后端联调
- 部署上线
-
燃尽图:
- 遇到了哪些困难:
- ant design vue的走马灯怎么这么奇奇怪怪的
- 有哪些收获和疑问:
- 收获:好耶百度谷歌搜索技术更进一步
- 疑问:究竟要怎么筛选
- PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 20 | 10 |
Estimate | 估计这个任务需要多少时间 | 5 | 10 |
Development | 开发 | - | - |
Analysis | 需求分析 &ppt&(包括学习新技术) | 30 | 40 |
Design Spec | 生成设计文档 | - | - |
Design Review | 设计复审 | - | - |
Coding Standard | 代码规范 (为目前的开发制定合适的规范) | ||
Design | 具体设计 | 30 | 60 |
Coding | 具体编码 | 70 | 120 |
Code Review | 代码复审 | 20 | 20 |
Test | 测试(自我测试,修改代码,提交修改) | - | - |
Reporting | 报告 | - | - |
Test Repor | 测试报告 | - | - |
100Size Measurement | 计算工作量 | 5 | 5 |
Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 10 | 10 |
Total | 合计 | 150 | 275 |
- 学习进度表
第N轮次 | 新增代码(行) | 累计代码(行) | 本次学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1 | 450 | 450 | 3.5 | 3.5 | 重新用上了vue,算是一次复建吧 |
2 | 600 | 1050 | 4 | 7.5 | 佛系ant design vue玩家 |
3 | 500 | 1550 | 4.5 | 12 | 学习滑轮插件,整理布局 |
周浩东:
-
过去两天完成了哪些任务:
- 进行本体建模
-
github签入记录
-
接下来计划:
- 完善本体建模和本体知识推理
- 进行知识抽取
-
还剩下哪些任务:
- 本体知识推理
- 知识抽取
- 部署上线
- 知识融合
-
燃尽图
-
遇到了哪些困难:
- 本体建模知识多,工具不易读
-
有哪些收获和疑问:
- 实践了本体建模
-
PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 20 | 10 |
Estimate | 估计这个任务需要多少时间 | 20 | 20 |
Development | 开发 | - | - |
Analysis | 需求分析 &ppt&(包括学习新技术) | 10 | 10 |
Design Spec | 生成设计文档 | - | - |
Design Review | 设计复审 | - | - |
Coding Standard | 代码规范 (为目前的开发制定合适的规范) | ||
Design | 具体设计 | 10 | 5 |
Coding | 具体编码 | 60 | 30 |
Code Review | 代码复审 | 30 | 30 |
Test | 测试(自我测试,修改代码,提交修改) | - | - |
Reporting | 报告 | - | - |
Test Repor | 测试报告 | - | - |
100Size Measurement | 计算工作量 | 5 | 5 |
Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 10 | 10 |
Total | 合计 | 95 | 100 |
- 学习进度表
第N轮次 | 新增代码(行) | 累计代码(行) | 本周学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1 | 100 | 100 | 10 | 10 | 学习了知识的表示形式 |
2 | 0 | 100 | 10 | 10 | 学习了知识本体建模 |
3 | 0 | 100 | 10 | 10 | 实践知识本体建模 |
潘春佳:
-
过去两天完成了哪些任务:
-
看视频学知识
-
GitHub签入记录:
-
-
接下来计划:
博客文档编辑、寻找制作漂亮的界面图 -
还剩下哪些任务:
后期UI设计,ppt报告编写 -
燃尽图
-
遇到了哪些困难:
考试临近,时间安排困难 -
有哪些收获和疑问:
布局的深入使用、新发现几个好看的UI网站 -
PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | - | - |
Estimate | 估计这个任务需要多少时间 | 300 | 300 |
Development | 开发 | - | - |
Analysis | 需求分析 (包括学习新技术) | 260 | 260 |
Design Spec | 生成设计文档 | 100 | 100 |
Design Review | 设计复审 | 0 | 0 |
Coding Standard | 代码规范 (为目前的开发制定合适的规范) | 0 | 0 |
Design | 具体设计 | 0 | 0 |
Coding | 具体编码 | 0 | 0 |
Code Review | 代码复审 | 0 | 0 |
Test | 测试(自我测试,修改代码,提交修改) | 0 | 0 |
Reporting | 报告 | - | - |
Test Report | 测试报告 | 0 | 0 |
Size Measurement | 计算工作量 | 0 | 0 |
Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 0 | 0 |
Total | 合计 | 360 | 360 |
- 学习进度表
第N次 | 新增代码(行) | 累计代码(行) | 本次学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1 | 0 | 0 | 3 | 3 | 学习新知识 |
2 | 0 | 0 | 3 | 6 | 看视频学东西 |
3 | 50 | 50 | 4 | 10 | 尝试界面制作 |
蔡树峰:
-
过去两天完成了哪些任务
-
撰写博客
-
组织第三次会议,进行会议记录
-
看视频学习Java后端开发
-
展示GitHub当日代码/文档签入记录
暂无
-
-
接下来的计划
- 继续写博客
- 学习Java后端开发
-
还剩下哪些任务
- 写博客
- 做视频
- 整理文档
-
燃尽图
-
遇到了哪些困难
马上两门考试要来了
-
有哪些收获和疑问
学会如何做一个时间管理大师
-
PSP & 学习进度条(学习进度条每周追加)
PSP:
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 10 10 · Estimate · 估计这个任务需要多少时间 5 5 Development 开发 60 60 · Analysis · 需求分析 (包括学习新技术) 5 8 · Design Spec · 生成设计文档 - - · Design Review · 设计复审 - - · Coding Standard · 代码规范 (为目前的开发制定合适的规范) - - · Design · 具体设计 - - · Coding · 具体编码 - - · Code Review · 代码复审 - - · Test · 测试(自我测试,修改代码,提交修改) - - Reporting 报告 40 40 · Test Repor · 测试报告 - - · Size Measurement · 计算工作量 5 5 · Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5 · 合计 130 133 学习进度表:
第N次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长 1 0 0 2 2 数据库操作 2 100 100 1.5 3.5 - 3 0 100 3 6.5 -
林蒋辉:
-
过去两天完成了哪些任务:
- 查找关于词频统计的实现方法
- 了解lucene的大概方法和接口
-
接下来计划:
- 对比基于lucene的solr实现挑选一种开始着手实现
-
还剩下哪些任务:
- 实现词频统计
-
燃尽图:
-
遇到了哪些困难:
- 时间不足,下周两门难度较大的考试
-
有哪些收获和疑问:
- 了解了实现检索功能的各种方法
-
PSP表格
PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 30 30 Estimate 估计这个任务需要多少时间 10 10 Development 开发 400 360 Analysis 需求分析 &ppt&(包括学习新技术) 400 400 Design Spec 生成设计文档 - - Design Review 设计复审 - - Coding Standard 代码规范 (为目前的开发制定合适的规范) - - Design 具体设计 - - Coding 具体编码 - - Code Review 代码复审 - - Test 测试(自我测试,修改代码,提交修改) - - Reporting 报告 10 15 Test Repor 测试报告 - - 100Size Measurement 计算工作量 5 5 Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 5 10 Total 合计 860 830 -
学习进度表
第N轮次 新增代码(行) 累计代码(行) 本次学习耗时(小时) 累计学习耗时(小时) 重要成长 1 0 0 6 6 参考了长文本存储的数据库设计,对检索功能的实现有了一定的想法 2 107 107 1 1 3 0 0 0 0 了解了一种web开发中一种重要功能的实现
-
陈宇扬:
-
过去两天完成了哪些任务:
- 继续学习爬虫相关技术
- 完成了广东省人民政府政策文件接口。
-
接下来计划:
- 完成上海市人民政府及其下属部门政策文件的爬取。
-
还剩下哪些任务:
- 其他省份政策相关获取;
- 其他省份下属地级市相关政策获取;
-
遇到了哪些困难:
- 内容详情页获取到的数据常常会夹带一些不必要的信息,需要去除;
-
有哪些收获和疑问:
- 完成了广东省人民政府粤府令部分列表页内容的获取;
- 不必要信息的标签通常与正文相同,难以筛除。
-
PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | ||
· Estimate | · 估计这个任务需要多少时间 | 20 | 15 |
Development | 开发 | ||
· Analysis | · 需求分析 (包括学习新技术) | 100 | 130 |
· Design Spec | · 生成设计文档 | - | - |
· Design Review | · 设计复审 | - | - |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 10 | 10 |
· Design | · 具体设计 | - | - |
· Coding | · 具体编码 | 150 | 180 |
· Code Review | · 代码复审 | 10 | 10 |
· Test | · 测试(自我测试,修改代码,提交修改) | 5 | 5 |
Reporting | 报告 | ||
· Test Repor | · 测试报告 | - | - |
· Size Measurement | · 计算工作量 | 10 | 10 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 10 | 15 |
合计 | 315 | 375 |
- 学习进度表
第N轮次 | 新增代码(行) | 累计代码(行) | 本周学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1(alpha) | 280 | 280 | 6.75 | 6.75 | 学习了爬虫技术,完成了一些内容的初步爬取。 |
2(alpha) | 200 | 480 | 5.41 | 12.16 | 完成广东省一部分内容的爬取 |
2(alpha) | 240 | 720 | 6.25 | 18.41 | 完成大部分广东省政策文件的获取 |
三、冲刺成果展示
-
展示组内最新成果
- 完成前端主页面设计
- 建立数据库
- 完成前端主页面设计
-
站立会议合照
-
会议耗时记录(每次追加记录)
第N次会议 | 耗时(分钟) |
---|---|
1 | 10 |
2 | 8 |
3 | 10 |