spider

from lxml import etree
import  requests
def getHtml(html):
    novelcontent = requests.get(html).content
    return etree.HTML(novelcontent)

source = getHtml("http://www.cabintu.com")

listclassify = source.xpath('//ul[@class="sg_menu"]/li/a')
listtype = source.xpath('//div[@class="mainleft"]/ul[@class="sg_menu"]/li[@class="section"]//ul[@class="subnav_a"]/li[@class="airline"]/a')

for i in range(0,len(listclassify)-1):
    fname = source.xpath('//div[@class="mainleft"]/ul[@class="sg_menu"]/li[@class="section"]/a/text()')[i]
    print fname



for n in range(0,len(listtype)-1):
    typelist = source.xpath('//div[@class="mainleft"]/ul[@class="sg_menu"]/li[@class="section"]//ul[@class="subnav_a"]/li[@class="airline"]/a/text()')[n]
    print typelist



#    for n in range(0,)


#      ftypelist = source.xpath('//div[@class="mainleft"]/ul[@class="sg_menu"]/li[@class="section"]/ul[@class="subnav_a"]/li[@class="airline"]/a/text()')[i]

查看全文

相关阅读:
解决动态加载数据滑动失效
 js 判断手机横竖屏的实现方法（不依赖任何其他库）
element-ui upload 图片格式验证，文件验证
 swiper 绑定点击事件点击失效处理
 vue项目
 [Qt]自定义表头实现过滤功能
 字符串截取问题
 mysql超时机制
 nginx原理
 高可用集群(主从模式)

原文地址：https://www.cnblogs.com/cutepython/p/6102824.html