zoukankan      html  css  js  c++  java
  • Java下载网页HTML代码

    Java下载网页HTML代码 - 高飞航的日志 - 网易博客

    Java下载网页HTML代码   

     

    2010-04-15 10:36:25|  分类:
    Java
    |  标签: 

    |字号  订阅

    标签:java 下载 获取 html 代码

           通过URL获取网页的HTML代码。 

    import java.io.BufferedReader; 
    import java.io.InputStreamReader;


    import java.net.HttpURLConnection;


    import java.net.URL;



    public class HTMLSpirit {


        
    public static String getHTML(String pageURL, String encoding) {


            StringBuilder pageHTML 
    = new StringBuilder();


            
    try {


                URL url 
    = new URL(pageURL);


                HttpURLConnection connection 
    = (HttpURLConnection) url.openConnection();


                connection.setRequestProperty(
    "User-Agent""MSIE 7.0");


                BufferedReader br 
    = new BufferedReader(new InputStreamReader(connection.getInputStream(), encoding));


                String line 
    = null;


                
    while ((line = br.readLine()) != null) {


                    pageHTML.append(line);


                    pageHTML.append(
    "\r\n");


                }


                connection.disconnect();


            } 
    catch (Exception e) {


                e.printStackTrace();


            }


            
    return pageHTML.toString();


        }


        


        
    public static void main(String args[]){


            System.out.println(getHTML(
    "http://www.baidu.com""GB2312"));


        }


    }

  • 相关阅读:
    线段树优化建图 && CF-786B.Legacy(优化建图,dijkstra)
    构建高性能JavaScript应用
    关于互联网应用前端架构的一些思考
    Router模块
    View模块
    Backbone源码解析系列
    Model模块
    Events模块
    Backbone源码风格
    jQuery选择器总结
  • 原文地址:https://www.cnblogs.com/lexus/p/2375359.html
Copyright © 2011-2022 走看看