zoukankan      html  css  js  c++  java
  • 通过w3c方式 读取xml内容

    /**
         * 通过w3c方式 读取xml内容
         * @param lablenames    要读取的节点名称
         * @param file_path_name 文件绝对路径
         * @return
         */
        public static WebMagic readXML(List<String> lablenames, String file_path_name) {
    
            
            WebMagic webMagic = new WebMagic();
    
            try {
                DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();
    
                DocumentBuilder builder = factory.newDocumentBuilder();
    
                org.w3c.dom.Document document = builder.parse(new File(file_path_name));
    
                org.w3c.dom.Element rootElement = document.getDocumentElement();
    
                for (int i = 0; i < lablenames.size(); i++) {
                    NodeList list = rootElement.getElementsByTagName(lablenames.get(i));
                    
                    org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);
    
                    System.out.println(element.getChildNodes().item(0).getNodeValue());
    
                    if ("starturl".equals(element.getNodeName())) {
                        webMagic.setStarturl(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("regexstarturl".equals(element.getNodeName())) {
                        webMagic.setRegexstarturl(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("labelName".equals(element.getNodeName())) {
                        webMagic.setLabelName(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("labeltype".equals(element.getNodeName())) {
                        webMagic.setLabeltype(element.getChildNodes().item(0)
                                .getNodeValue());
                    }
                    if ("regexdescendants".equals(element.getNodeName())) {
                        webMagic.setRegexdescendants(element.getChildNodes()
                                .item(0).getNodeValue());
                    }
    
                }
    
            } catch (Exception e) {
    
                System.out.println("exception:" + e.getMessage());
    
            }
            return webMagic;
    
        }
  • 相关阅读:
    cmanformat
    mysql-sql语言参考
    jQuery 判断多个 input checkbox 中至少有一个勾选
    Java实现 蓝桥杯 算法提高 计算行列式
    Java实现 蓝桥杯 数独游戏
    Java实现 蓝桥杯 数独游戏
    Java实现 蓝桥杯 数独游戏
    Java实现 蓝桥杯 算法提高 成绩排序2
    Java实现 蓝桥杯 算法提高 成绩排序2
    Java实现 蓝桥杯 算法提高 成绩排序2
  • 原文地址:https://www.cnblogs.com/baihaojie/p/5783219.html
Copyright © 2011-2022 走看看