zoukankan      html  css  js  c++  java
  • htmilunit-- 针对抓取js生成的数据

    public static String  getHtml(String html){
            // 模拟一个浏览器  
            @SuppressWarnings("resource")
            WebClient webClient = new WebClient();  
            //webclient参数载体  
            WebClientOptions clientOptions = webClient.getOptions();  
            // 设置webClient的相关参数  
            clientOptions.setJavaScriptEnabled(true);  
            clientOptions.setCssEnabled(false);  
            webClient.setAjaxController(new NicelyResynchronizingAjaxController());  
            clientOptions.setTimeout(35000);  
            clientOptions.setThrowExceptionOnScriptError(false);  
            // 模拟浏览器打开一个目标网址  
            HtmlPage rootPage = null;
            try {
                rootPage = webClient.getPage(html);
            } catch (FailingHttpStatusCodeException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            } catch (MalformedURLException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }  
               //body html信息  
            HtmlElement htmlElement = rootPage.getBody();  
            String xmlContent = htmlElement.asXml();  
            return xmlContent;
    }

  • 相关阅读:
    iOS项目之wifi局域网传输文件到iPhone的简单实现
    iOS项目之苹果审核被拒
    iOS项目之模拟请求数据
    nvm-window常用命令
    初探浏览器渲染原理
    node + mongodb 简单实现自己的查询接口
    快速理解_.debounce方法
    tr标签使用hover的box-shadow效果不生效
    一个简单的Node命令行程序:文件浏览
    打造丝般顺滑的 H5 翻页库(传送门)
  • 原文地址:https://www.cnblogs.com/lixiuming521125/p/7058621.html
Copyright © 2011-2022 走看看