scrapy crawl xmlfeed spider

from scrapy.spiders import XMLFeedSpider
from myxml.items import MyxmlItem

class XmlspiderSpider(XMLFeedSpider):
    name = 'xmlspider'
    allowed_domains = ['sina.com.cn']
    start_urls = ['http://blog.sina.com.cn/rss/1165656262.xml']
    iterator = 'iternodes' # you can change this; see the docs
    itertag = 'rss' # change it accordingly

    def parse_node(self, response, selector):
        i =MyxmlItem()
        i['title'] = selector.xpath('/rss/channel/item/title/text()').extract()
        #i['url'] = selector.select('url').extract()
        #i['name'] = selector.select('name').extract()
        #i['description'] = selector.select('description').extract()
        for j in range(len(i['title'])):
            print(i['title'][j])
        return i

查看全文

相关阅读:
【持久化框架】Mybatis与Hibernate的详细对比
 [Linux] day03——REHL部署
 [Linux] day02——什么是Linux
[Linux] day01——运维
 java也可以做出很漂亮的界面
 python的沙盒环境--virtualenv
Java虚拟机（JVM）中的内存设置详解
 高手教大家如何配置JVM参数
 最全的静态网站生成器（开源项目）
Java 8 简明教程

原文地址：https://www.cnblogs.com/Erick-L/p/6835510.html