例会照片
任务更新
姓名 | 今日完成任务 | 实际花费时间 | 明日任务 | 预计花费时间 |
---|---|---|---|---|
谢振威 | #4 提取html的编码格式并且处理 | 4h | #4提取更多信息 | 4h |
杨金键 | #4 html处理模块 | 4h | #5 看看图片里隐藏了什么神秘代码 | 4h |
谷大鑫 | 定义处理完成后数据格式以及上传到solr(未完成) | 3h | #10 整理上届β版本代码,寻找其中连接solr的部分 | 4h |
崔正龙 | 因为在写编译所以未完成 | - | #11 重读上届β版本代码中数据处理部分,选择合适的分词器 | 4h |
金豪 | #9 学习爬虫数据库相关连接方法并写成文档 | 4.5h | #8 弄清楚爬虫部分主要代码逻辑以及输出部分定义 | 6h |