zoukankan      html  css  js  c++  java
  • 使用SimpleXML解析xml文件数据

    最近工作要求从一个XML文档中批量读取APK应用数据,自然想到用SimpleXML。经过一段时间摸索,终于成功解析,现在将思路以及代码做下记录:

    xml文件格式大致如下:

    <?xml version="1.0" encoding="UTF-8"?>
    
    <!DOCTYPE html>
    
    <html xmlns="http//www.w3.org/1999/xhtml" xml:lang="en">
    
      <body>
    
        <appinfos>
    
          <appinfo>
    
            <name>app1</name>
            <icon>http://www.baidu.com/pic/dxdfdf.png</icon>
    
            <downurl>http://www.baidu.com/down/sdkdfk.apk</downurl>
    
            <screenshot1>http://www.baidu.com/pic/sdfuererieir.png</screenshot1>
    
          </appinfo>
    
            <name>app2</name>
    
            <icon>http://www.baidu.com/pic/dxdfdf.png</icon>
    
            <downurl>http://www.baidu.com/down/sdkdfk.apk</downurl>
    
            <screenshot1>http://www.baidu.com/pic/sdfuererieir.png</screenshot1>
    
          </appinfo>
    
            <name>app3</name>
    
            <icon>http://www.baidu.com/pic/dxdfdf.png</icon>
    
            <downurl>http://www.baidu.com/down/sdkdfk.apk</downurl>
    
            <screenshot1>http://www.baidu.com/pic/sdfuererieir.png</screenshot1>
    
          </appinfo>
    
        </appinfos>
    
      </body>
    
    </html>

    我得需求是要从这个文件中得到所有的apk信息(apk1,apk2,apk3....)。php代码是这样的:

    <?php
    header("content-type:text/html;charset=utf-8");
    error_reporting(E_ALL);
    $xmlObj = simplexml_load_file("new.xml");
    foreach($xmlObj->body->appInfos->appInfo as $key => $val){
        foreach($val as $ck => $cv){
            $arr[$ck] = (string)$cv;  //这个地方的string做了强制转换,否则系统会仍为$cv是一个simpleXML对象,这样是得不到字符串结果的
        }
        var_dump($arr);
        $str = json_encode($arr);
        file_put_contents("data.txt",$str."
    ",FILE_APPEND);
        $arr = array();
    }

    观察这行代码:$xmlObj->body->appInfos->appInfo可以发现,SimpleXML的操作类似于一个嵌套对象,一级一级往下找,找到appInfo发现是多个,后面的代码遍历一下就得到结果了。

    注意xml的标准比较严格,实体&,<,>,',"需要分别转义成&amp;,$lt;,$gt;,$apos;,$quot;

    最末级的数据比如:<icon>http://www.baidu.com/pic/006.png</icon>,在</icon>前如果有换行读取时也是会报错的。还有,<br />一定要这样写才行。

    坚持!
  • 相关阅读:
    sed使用之处理文件命令, 注意不是sed的选项
    oracle label security(OLS)相关主体流程整理
    nginx配置使用, 入门到实践
    shell中sed的使用及选项, 编辑器中的&作用
    echo带颜色文本, shell中单引号和双引号区别, [], 反引号及位置参数使用
    vue-cli流程初识笔记
    Python之函数
    Django之ModelForm组件
    CRM【第三篇】: crm业务
    CRM【第二篇】: stark组件
  • 原文地址:https://www.cnblogs.com/doubilaile/p/4574376.html
Copyright © 2011-2022 走看看