项目名称 |
Pipeline |
项目版本 |
Beta版本 |
负责人 |
北京航空航天大学计算机学院 C705团队 |
联系方式 |
|
发布日期 |
2014-12-28 |
更新内容:
1.修复缺陷:
a)修复了数据库插入异常
b)翻译功能的更新和优化
2.新功能:
a)增加对问答对的信息处理
第二次迭代中,我们积极地同第三组沟通,了解到他们需要实现的核心功能需要我们为他们提供一个新的数据库,这个数据库存放了问答网站的地址以及问题的相关信息。因此我们筛选了六个常用的问答网站(百度知道,搜搜问问,德问,stackoverflow,cnblog,),向爬虫们提出了尽量爬取这六个网站的需求,我们将网站中的有效信息提取出来存入数据库提供给下一组使用。
b)可持续处理数据
在alpha阶段结束的时候,我们还有一个问题没有解决,那就是如何让这个程序能够绵绵不绝地处理数据库中新爬到的网站,这也是我们整个学霸项目能够运行的重点所在。不负众望,我们做到了这一点,能够不断处理数据库中新添的数据。
环境要求:
操作系统需求 |
Windows操作系统 |
运行环境需求 |
无 |
数据库需求 |
需配置数据库到Windows(或Windows server)数据源中 |
安装方法:
直接解压安装,在PipelinePipelineinDebug文件夹中找到Pipeline.exe可以打开程序。
系统已知的问题和限制:
a)图片信息无法提取
b)问题时间获取与该提问网站设计有关,可能不够准确
软件的发布方式以及发布地址:
代码发布在服务器219.224.191.25上,与其他学霸小组整合为学霸网站。