资料:
剖析NUTCH爬虫:http://www.cnblogs.com/abob/archive/2006/08/31/490848.html
基于Java技术的主题网络爬虫的研究与实现:http://www.doc88.com/p-19620823381.html
网络爬虫讨论bbs:http://bbs.csdn.net/topics/370228914
使用 HttpClient 和 HtmlParser 实现简易爬虫(IBM论坛):https://www.ibm.com/developerworks/cn/opensource/os-cn-crawler/
Java写的爬虫的基本程序:http://playfish.iteye.com/blog/150126
java爬虫源码下载:http://download.csdn.net/detail/sundonet/1478480
javaweb开源爬虫网站:http://www.open-open.com/68.htm