zoukankan      html  css  js  c++  java
  • Python 初识爬虫-**机场出港业务

    # -*- coding:utf-8 -*-
    from lxml import etree
    import requests
    
    ##先进单页测试,然后在进行多页循环 没有解决的问题,动态解决最大页数,目前是默认11页
    for page in range(1,12):
        for i in range(1,21):##每页都是20条信息,每一行5列信息
            for j in range(1,6):
                ##单页测试
                url = 'http://www.tbia.cn/cn/dynamicflight/dynamicflightInfo/list.do?page='+str(page)
                headers = {
                    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36'}
                data = requests.get(url, headers=headers)
                data.encoding = 'utf-8'  ##中文乱码解决方案
                s = etree.HTML(data.text)
                info = s.xpath('//table[@class="flighttable"]/tbody/tr['+str(i)+']/td['+str(j)+']/node()')  # **机场
                print(""+str(page)+""+""+str(i)+""+""+str(j)+"")
                list.append(info)
    print(list)
    
    ##list即为结果
  • 相关阅读:
    【Qt】Qt软件打包发布
    最大公约数最小公倍数
    random实现验证码
    sort 和sorted的 区别
    Python-内置数据结构之元组(tuple)
    BZOJ 1112 线段树
    POJ 1682 DP
    POJ 1671 第二类斯特林数
    BZOJ 1592 DP
    POJ 1636 DFS+DP
  • 原文地址:https://www.cnblogs.com/0909/p/9889038.html
Copyright © 2011-2022 走看看