zoukankan      html  css  js  c++  java
  • 爬取12306车次信息

    #!/usr/bin/python2.7
    # -*- coding:utf-8 -*-
    # 2017-10-19
    
    """
    12306 抢票
    
    网页分析
        - 查看网页源码
        - 判断是否通过异步加载或者框架的形式接收并展示数据
        - 数据加密过,然后前端再通过js解密并展示(即js混淆)
    
    
    urllib2.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:590)>
    证书作用:保证数据在传输的过程中不会被篡改或截取
    """
    
    import sys
    reload(sys)
    sys.setdefaultencoding('utf8')
    
    import ssl
    import json
    import urllib2
    
    # 跳过证书验证
    ssl._create_default_https_context = ssl._create_unverified_context
    
    headers = {
        'Referer':'https://kyfw.12306.cn/otn/leftTicket/init',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'
    }
    
    def getTrainList():
        url = "https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2017-10-20&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=CDW&purpose_codes=ADULT"
        req = urllib2.Request(url)
        req.headers = headers
        html = urllib2.urlopen(req).read()
        res = json.loads(html)
        return res['data']['result']
    
    if __name__ == '__main__':
        c = 0
        for i in getTrainList():
            tmp_list = i.split('|')
            # print "%s	%s	%s" % (tmp_list[13],tmp_list[23],tmp_list[3])
            if tmp_list[23] == u'有':
                print "时间:%s 车次:%s 软卧有很多票..." % (tmp_list[13],tmp_list[3])
            elif tmp_list[23] == u'无' or not tmp_list[23]:
                print "时间:%s 车次:%s 软卧无票..." % (tmp_list[13],tmp_list[3])
            elif int(tmp_list[23]) > 0:
                print "时间:%s 车次:%s 软卧有 %s 张票" % (tmp_list[13],tmp_list[3],tmp_list[23])
            else:
                print "时间:%s 车次:%s 软卧无票..." % (tmp_list[13], tmp_list[3])
    

      

    作者:Standby一生热爱名山大川、草原沙漠,还有妹子
    出处:http://www.cnblogs.com/standby/

    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

  • 相关阅读:
    Linux多线程Pthread学习小结
    TCP三次握手/四次挥手
    内存管理内幕
    Delphi 中分发设计时包
    一个小的算法问题解决
    写了一个验证数字范围的正则表达式
    用 XML 文件持久化和恢复图片信息
    string.Empty 和 "" 并不总是可以互换的
    博客园用的 FreeTextBox 有 bug
    乱花渐欲迷人眼。。。
  • 原文地址:https://www.cnblogs.com/standby/p/7858295.html
Copyright © 2011-2022 走看看