zoukankan      html  css  js  c++  java
  • Python实战:下载鬼灵报告有声小说

    在家无聊,想看看小说,不过看的眼睛痛,就想着下个有声小说来听听。但风上找到的都是要一集一集下,还得重命名,122集啊,点到什么时候。

    写个批处理下载的脚本。记录下过程。

    一、老套路了,找到下载URL。通过查看网页源码,发现主页:http://www.qktsw.com/down/1831.html  的下载列表隐藏在:

     

    打开这个js文件,看看是什么东西:

    看标红的东西,觉得眼熟,这不就是主页上面的下载列表的ID号么:

    二、获取id号:

    简单,正则表达式:

    m=re.compile(r'$(.*?)$')

    result=m.findall(content)

    i=0
    for s in result:

      print s

    result就是匹配的所有id列表了

     接下来,写进文件就可以了:

    fp = open(file, 'wb')
    req = urllib2.urlopen(url)
    for line in req:
     fp.write(line)
    fp.close()


    所有代码如下:
    #coding=utf-8
    __author__ = 'Administrator'
    
    import urllib2
    import re
    
    
    content = urllib2.urlopen('http://www.qktsw.com/playdata/39/1831.js').read()
    
    m=re.compile(r'$(.*?)$')
    
    result=m.findall(content)
    i=0
    rawStr='http://www.qktsw.com/downbook.asp?id='
    for s in result:
        print s
        i+=1
        fp = open(str(i)+'.f4v', 'wb')
        req = urllib2.urlopen(rawStr+s)
        for line in req:
            fp.write(line)
        fp.close()
        print '第%d集下完',i
    下载下来的:

    打开后可以正常听!嘿嘿,搞定

  • 相关阅读:
    MySQL-InnoDB锁(一)
    Java方法调用机制
    并发编程-锁相关的内存语义
    Java开发工具汇总
    并发编程-底层实现原理
    并发编程-Java内存模型
    JsonTest
    PTA(Basic Level)1034.有理数四则运算
    PTA(Advanced Level)1081.Rational Sum
    PTA(Advanced Level)1008.Elevator
  • 原文地址:https://www.cnblogs.com/cool-fire/p/4294966.html
Copyright © 2011-2022 走看看