zoukankan      html  css  js  c++  java
  • CSS选择器

    #coding=utf-8
    
    # 选择class=“info”的元素              .  info
    # 选择id = "firstname" 的元素              #firstname
    # 选择所有元素                             *
    # 选择所有<p>元素                          p
    # 选择所有div元素和p元素                   div,p
    # 选择div元素内的所有p元素                 div p
    # 选择带有target属性的所有元素             [target]
    # 选择target=“_blank”的所有元素          [target="_blank"]
    
    from scrapy.selector import Selector
    
    with open('.superHero.xml','r') as fp:
        body = fp.read()
    
        print '选取所有class的内容:'
        print Selector(text=body).css('class').extract()
    
        print '选取class下的name元素组:'
        print Selector(text=body).css('class name').extract()
    
        print '选择所有name 和 sex 元素组: '
        print Selector(text=body).css('name,sex').extract()
    
        print '选择带有lang 属性的所有元素:'
        print Selector(text=body).css('[lang]').extract()
    
        print '选择所有lang为en的所有元素:'
        print Selector(text=body).css('[lang=en]').extract()
    
    
    

    运行结果

    选取所有class的内容:
    [u'
    			Tony Stark 
    			Iron Man 
    			male 
    			1969 
    			47 
    		', u'
    			Peter BenJamin Parker 
    			Spider Man 
    			male 
    			unknow 
    			unknow 
    		', u'
    			Steven Rogers 
    			Caption America 
    			male 
    			19200704 
    			96 
    		']
    选取class下的name元素组:
    [u'Tony Stark ', u'Peter BenJamin Parker ', u'Steven Rogers ']
    选择所有name 和 sex 元素组: 
    [u'Tony Stark ', u'male ', u'Peter BenJamin Parker ', u'male ', u'Steven Rogers ', u'male ']
    选择带有lang 属性的所有元素:
    [u'Tony Stark ', u'Peter BenJamin Parker ', u'Steven Rogers ']
    选择所有lang为en的所有元素:
    [u'Tony Stark ', u'Peter BenJamin Parker ']
    
    

    superHero.xml

    <html>
    	<body>
    	<superhero>
    		<class>
    			<name lang="en">Tony Stark </name>
    			<alias>Iron Man </alias>
    			<sex>male </sex>
    			<birthday>1969 </birthday>
    			<age>47 </age>
    		</class>
    		<class>
    			<name lang="en">Peter BenJamin Parker </name>
    			<alias>Spider Man </alias>
    			<sex>male </sex>
    			<birthday>unknow </birthday>
    			<age>unknow </age>
    		</class>
    		<class>
    			<name lang="ch">Steven Rogers </name>
    			<alias>Caption America </alias>
    			<sex>male </sex>
    			<birthday>19200704 </birthday>
    			<age>96 </age>
    		</class>
    		</superhero>
    	</body>
    </html>
    
  • 相关阅读:
    2017第17周四当前工作中困境与挑战思考
    2017第17周三
    2017第17周二
    最小可行产品
    《穷查理宝典》中三条最重要的学习方法
    机场打车有感
    2017第15周五
    2017第15周四
    三条经济学原理帮你做出正确的选择
    Mac通过安装Go2Shell实现“在当前目录打开iTerm2”
  • 原文地址:https://www.cnblogs.com/laohaozi/p/12537797.html
Copyright © 2011-2022 走看看