今天看文章的时候脑子里闪过一个想法,赶紧记下来,后来发现google已经有了这种产品了,google太强了。
算了,把记的内容先保存在这里:
想法:
看一篇文章,想看哪些文章引用到这篇文章?
看一篇论文,想看哪些网页引用到这篇论文?看这篇论文适用于哪些领域?
查一个网址,查看哪些网页引用了这个网页?链接到这个网页?现在我想看的是哪些网页链接到这个网页,而不是这个网页链接到其他网页?
查一篇博客曾被哪些网页所引用过?
我想看http://www.kuqin.com/math/20071204/2776.html这个网页曾被哪些网页所引用过?然后我就可以阅读一大堆与这篇文章有关的网页(既然我认为这篇文章很好,我就想阅读一些与之相关的网页,因为链接到这篇文章的网页肯定还有链接到相同领域的其他网页例如http://www.kuqin.com/math/20071204/2798.html)。
可行性分析:
肯定可以实现。在爬取的时候如果此url已爬取过,则保存到此url.lastURLs库中