zoukankan      html  css  js  c++  java
  • Java下载网页HTML代码

    Java下载网页HTML代码 - 高飞航的日志 - 网易博客

    Java下载网页HTML代码   

     

    2010-04-15 10:36:25|  分类:
    Java
    |  标签: 

    |字号  订阅

    标签:java 下载 获取 html 代码

           通过URL获取网页的HTML代码。 

    import java.io.BufferedReader; 
    import java.io.InputStreamReader;


    import java.net.HttpURLConnection;


    import java.net.URL;



    public class HTMLSpirit {


        
    public static String getHTML(String pageURL, String encoding) {


            StringBuilder pageHTML 
    = new StringBuilder();


            
    try {


                URL url 
    = new URL(pageURL);


                HttpURLConnection connection 
    = (HttpURLConnection) url.openConnection();


                connection.setRequestProperty(
    "User-Agent""MSIE 7.0");


                BufferedReader br 
    = new BufferedReader(new InputStreamReader(connection.getInputStream(), encoding));


                String line 
    = null;


                
    while ((line = br.readLine()) != null) {


                    pageHTML.append(line);


                    pageHTML.append(
    "\r\n");


                }


                connection.disconnect();


            } 
    catch (Exception e) {


                e.printStackTrace();


            }


            
    return pageHTML.toString();


        }


        


        
    public static void main(String args[]){


            System.out.println(getHTML(
    "http://www.baidu.com""GB2312"));


        }


    }

  • 相关阅读:
    sun.misc.Unsafe
    一个普通Java程序包含哪些线程??
    类加载-类加载器
    类加载-类的生命周期
    类加载-初始化的触发
    Java语法糖
    Java线程池
    Java线程池之ThreadPoolExecutor
    【结构型】- 适配器模式
    数据结构与算法之排序(3)插入排序 ——in dart
  • 原文地址:https://www.cnblogs.com/lexus/p/2375359.html
Copyright © 2011-2022 走看看