zoukankan      html  css  js  c++  java
  • 如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)

    如何获得NIPS会议上批量下载的链接?

    NIPS会议下载网址:http://papers.nips.cc/

    a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图

    b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)

    下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


    下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


    c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)

    这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!

    1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合



    2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)

    我们先把<li><a href="替换成http://papers.nips.cc      再把">替换为.pdf    @@@@                        



    -------------------------------------------------------------------------------------------------------------------------------------------------------------------
    现在就得到以下的代码了,如图

    而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?


    接下来看小编怎么解决,这也是最重要的一步!!!!!!!!

    其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因)                     @@@@.*替换为       (这里敲3下空格键即可,我就是要替换空白)



    为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图



    得到下载链接,接下来就是用迅雷批量下载即可



    总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)

    04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr 

  • 相关阅读:
    Java进阶之并发初探
    Java进阶之HashMap剖析
    Java进阶之反射
    Linux常用命令
    海量数据处理算法与面试题
    一些刷题时总结的重要知识点
    一些Java刷题时的小知识点
    九章算法知识点与题目总结(不定时更新...)
    c++设计模式之状态模式
    c++设计模式之抽象工厂模式
  • 原文地址:https://www.cnblogs.com/Yiutto/p/4726552.html
Copyright © 2011-2022 走看看