zoukankan      html  css  js  c++  java
  • Python xml 解析百度糯米信息

    先利用爬虫利用百度糯米提供的api来采集北京当天的团购信息,保存为numi.html

    import xml.etree.ElementTree as ET
    import os

    class Nuomi():
        
        def __init__(self):
            
            self.numi=[]
        def Parse(self,filepath):

            tree=ET.parse(filepath)
            root =tree.getroot()
            for url in root.iter('url'):
                nuomi_lei={}
                data=url.find('data')
                if data is not None:
                    display=data.find('display')
                    if display is not None:
                        try:
                            nuomi_lei['title']=display.find('title').text
                        except Exception as e:
                            print("No title")
                        try:
                            nuomi_lei['businessTitle']=display.find('businessTitle').text
                        except Exception as e:
                            print ("No businessTitle")
                        try:
                            nuomi_lei['value'] =display.find('value').text
                        except Exception as e:
                            print ("No value")
                        try:
                            nuomi_lei['price']=float(display.find('price').text)
                        except Exception as e:
                            print("No pire")
                        self.numi.append(nuomi_lei)
            return(self.numi)

        
    if __name__ == '__main__':
        
        nuomi=Nuomi()
        date=nuomi.Parse('numi.html')
        print(len(date))
       

  • 相关阅读:
    labview 中的一些简写全称
    socket
    putty
    在波形图表中显示多条曲线
    简单的通电延时触发电路
    Linux sed 批量替换多个文件中的字符串
    PhpMyAdmin管理,登录多台远程MySQL服务器
    MySQL客户端工具推荐
    Redis的几个认识误区
    Redis 的 5 个常见使用场景
  • 原文地址:https://www.cnblogs.com/leiziv5/p/5735235.html
Copyright © 2011-2022 走看看