项目名称 |
Crawling is going on |
项目版本 |
Beta版本 |
负责人 |
北京航空航天大学计算机学院 远航1617 小组 |
联系方式 |
http://www.cnblogs.com/yuanhang1617 |
要求发布日期 |
2013-12-24 |
文档作者 |
杨帆 |
1 更新内容
1.1 修复缺陷
a) 异常处理功能已修复,对于客户端的异常具有容错能力。
b) 广告过滤功能已优化,支持更广泛的爬取源网址。
1.2 新增功能
a) 可以选择源网址输入方式,一次性输入多个源网址。
b) 界面进行了排版和优化。
c) 支持网页上pdf文件的爬取。
d) 新增分析功能,对数据库内爬取文件的类型和数量进行统计,以饼状图的形式展示。
1 环境要求
操作系统需求 |
WINDOWS操作系统 |
运行环境需求 |
最新版本的JDK 和JRE |
数据库需求 |
需配置数据库到Windows(或Windows server)数据源中, 数据库名为yuanhang。 |
旧版本处理方式 |
备份处理 |
2 安装说明
2.1 更新方法
将软件压缩包中的全部文件解压到本地,覆盖所有原文件。
2.2 回退预案
使用备份文件替换。
3 已知缺陷和限制
a) 软件运行因服务器端异常而中断的情况没有消除。
4 发布地址
该版本代码发布在服务器219.224.191.24上,可自行下载试用。