zoukankan      html  css  js  c++  java
  • 利用python解析xml, json

     XML

    需要到的库:

    from xml.dom.minidom import parse
    import xml.dom.minidom

    豆瓣sitemap_index.xml格式如下(2016-10-29):

    <sitemapindex>
        <sitemap>
            <loc>https://www.douban.com/sitemap3782.xml.gz</loc>
            <lastmod>2016-10-19T10:36:31Z</lastmod>
        </sitemap>
        <sitemap>
            <loc>https://www.douban.com/sitemap3783.xml.gz</loc>
            <lastmod>2016-10-19T10:36:31Z</lastmod>
        </sitemap>
    </sitemapindex>

    解析过程:

    xml_str=douban.sitemap.xml
    DOMTree =xml.dom.minidom.parseString(xml_str)
    collection = DOMTree.documentElement
    elements=collection.getElementsByTagName("sitemap")
    for i in elements:
        a=i.getElementsByTagName("loc")
        print(a[0].childNodes[0].nodeValue)

     Json

    map={}
    for i in range(0,3783):
        map[i]=0
    
    with open("text\sitemap_config.json","w") as f:
        json.dump(map,f)
    
    map={}
    with open("text\sitemap_config.json", 'r') as f:
        map = json.load(f)
    print(map)
  • 相关阅读:
    Windows Phone 7 电话本相关的操作
    Windows CE 下判断 URL 地址是否有效
    cigarettes
    开灯问题
    日期计算
    小学生算术
    另一种阶乘问题
    鸡兔同笼
    笨小熊
    6174问题
  • 原文地址:https://www.cnblogs.com/fei-hsueh/p/6106284.html
Copyright © 2011-2022 走看看