zoukankan      html  css  js  c++  java
  • 通过w3c方式 读取xml内容

    /**
         * 通过w3c方式 读取xml内容
         * @param lablenames    要读取的节点名称
         * @param file_path_name 文件绝对路径
         * @return
         */
        public static WebMagic readXML(List<String> lablenames, String file_path_name) {
    
            
            WebMagic webMagic = new WebMagic();
    
            try {
                DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();
    
                DocumentBuilder builder = factory.newDocumentBuilder();
    
                org.w3c.dom.Document document = builder.parse(new File(file_path_name));
    
                org.w3c.dom.Element rootElement = document.getDocumentElement();
    
                for (int i = 0; i < lablenames.size(); i++) {
                    NodeList list = rootElement.getElementsByTagName(lablenames.get(i));
                    
                    org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);
    
                    System.out.println(element.getChildNodes().item(0).getNodeValue());
    
                    if ("starturl".equals(element.getNodeName())) {
                        webMagic.setStarturl(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("regexstarturl".equals(element.getNodeName())) {
                        webMagic.setRegexstarturl(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("labelName".equals(element.getNodeName())) {
                        webMagic.setLabelName(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("labeltype".equals(element.getNodeName())) {
                        webMagic.setLabeltype(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("regexdescendants".equals(element.getNodeName())) {
                        webMagic.setRegexdescendants(element.getChildNodes()
                                .item(0).getNodeValue());
                    }
    
                }
    
            } catch (Exception e) {
    
                System.out.println("exception:" + e.getMessage());
    
            }
            return webMagic;
    
        }
  • 相关阅读:
    JS完整获取IE浏览器信息
    C# DataSet和DataTable详解
    linux下mysql导入数据
    Linux上安装mysql
    JDK6+tomcat7+mysql官网下载地址
    Linux常用命令
    mysql 授权
    tomcat7.0学习笔记
    struts2 <s:property/>标签的使用输出时间格式转换
    Linux如何查找软件安装路径?
  • 原文地址:https://www.cnblogs.com/mengyuxin/p/5635352.html
Copyright © 2011-2022 走看看