zoukankan      html  css  js  c++  java
  • Python xml 解析百度糯米信息

    先利用爬虫利用百度糯米提供的api来采集北京当天的团购信息,保存为numi.html

    import xml.etree.ElementTree as ET
    import os

    class Nuomi():
        
        def __init__(self):
            
            self.numi=[]
        def Parse(self,filepath):

            tree=ET.parse(filepath)
            root =tree.getroot()
            for url in root.iter('url'):
                nuomi_lei={}
                data=url.find('data')
                if data is not None:
                    display=data.find('display')
                    if display is not None:
                        try:
                            nuomi_lei['title']=display.find('title').text
                        except Exception as e:
                            print("No title")
                        try:
                            nuomi_lei['businessTitle']=display.find('businessTitle').text
                        except Exception as e:
                            print ("No businessTitle")
                        try:
                            nuomi_lei['value'] =display.find('value').text
                        except Exception as e:
                            print ("No value")
                        try:
                            nuomi_lei['price']=float(display.find('price').text)
                        except Exception as e:
                            print("No pire")
                        self.numi.append(nuomi_lei)
            return(self.numi)

        
    if __name__ == '__main__':
        
        nuomi=Nuomi()
        date=nuomi.Parse('numi.html')
        print(len(date))
       

  • 相关阅读:
    jsp报源码
    c#简单写售票系统
    linux常用命令大全[转]
    【转载】大型网站渗透思之信息收集
    Ajax初窥
    屏蔽win10中文输入法
    win10禁止更新的方法
    win10进入到安全模式的三种方法
    7代CPU安装win7的方法
    python的输出问题
  • 原文地址:https://www.cnblogs.com/leiziv5/p/5735235.html
Copyright © 2011-2022 走看看