zoukankan      html  css  js  c++  java
  • [java] jsoup 解析网页获取省市区域信息

    到国家统计局抓取数据,

    到该class下解析数据

    /**
     * jsoup解析网页
     * @author xwolf
     * @date 2016-12-13 18:11
     * @since V1.0.0
     */
    public class JsoupUtil {
    
        public static JSONObject parse(String url){
            JSONObject json=new JSONObject();
            URL purl= null;
            try {
                purl = new URL(url);
                Document document=Jsoup.parse(purl,1000);
                Element elements=document.body();
               Elements findEles= elements.getElementsByClass("MsoNormal");
    
               for(Element ele:findEles){
                  Elements langSpans= ele.getElementsByAttribute("lang");
                  Elements  nameSpans=ele.getElementsByAttribute("style");
                   for(int i=0;i<langSpans.size();i++){
                       json.put(langSpans.get(i).text().trim(),nameSpans.get(i).text().trim());
                   }
               }
               return json;
            } catch (Exception e) {
                e.printStackTrace();
            }
              return null;
        }
    
        public static void main(String[] args) {
           JSONObject json= parse("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html");
            System.out.println(json.toJSONString());
        }

    返回json,处理入库即可。

    附件:省市区域信息.zip

  • 相关阅读:
    SQL Server需要监控哪些计数器
    将表里的数据批量生成INSERT语句的存储过程 继续增强版
    [Java]
    [Linux] 安装JBoss
    [Spring]
    [Spring]
    [Maven]
    [Maven]
    [Spring MVC]
    [Spring MVC]
  • 原文地址:https://www.cnblogs.com/lonelywolfmoutain/p/6171086.html
Copyright © 2011-2022 走看看