zoukankan      html  css  js  c++  java
  • java小工具:通过URL连接爬取资源(图片)

    java语言编写一个简单爬取网站图片工具,实现简单:

    • 通过 java.net.HttpURLConnection 获取一个URL连接
    • HttpURLConnection 连接成功返回一个java.io.InputStream,通过InputStream读取图片放入到字节数组buff
    • 通过BufferedOutputStream(new FileOutputStream(new File("TEST.jpg"))) 形式 将内存buff里的图片数据写入到test.jpg文件中

    给出工具类的CatchIMG.java代码如下:

    /**   
    * @Title: CatchIMG.java 
    * @Package web1203.tools 
    * @Description: TODO(用一句话描述该文件做什么) 
    * @author penny  
    * @date 2017年12月3日 下午9:00:05 
    * @version V1.0   
    */
    package web1203.tools;
    
    import java.io.BufferedInputStream;
    import java.io.BufferedOutputStream;
    import java.io.File;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.OutputStream;
    import java.net.HttpURLConnection;
    import java.net.MalformedURLException;
    import java.net.URL;
    
    /** 
     * @ClassName: CatchIMG 
     * @Description: 爬取一个指定地址的网络图片
     * @author penny
     * @date 2017年12月3日 下午9:00:05 
     * 
     */
    public class CatchIMG {
    
    	/**
    	 * 
    	 * @Title: getImg 
    	 * @Description: 通过一个url 去获取图片
    	 * @param @param url 图片的连接地址
    	 * @param @throws IOException    
    	 * @throws
    	 */
    	public static void getImg(String url) throws IOException{
    		long startTime = System.currentTimeMillis();
    		URL imgURL = new URL(url.trim());//转换URL
    		HttpURLConnection urlConn = (HttpURLConnection) imgURL.openConnection();//构造连接
    		urlConn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36");
    		urlConn.connect();
    		System.out.println(CatchIMG.class.toString()+":获取连接="+urlConn.getResponseMessage());
    		if(urlConn.getResponseCode()==200){//返回的状态码是200 表示成功
    			InputStream ins = urlConn.getInputStream(); //获取输入流,从网站读取数据到 内存中
    			OutputStream out = new BufferedOutputStream(new FileOutputStream(new File("TEST.jpg")));
    			int len=0;
    			byte[] buff = new byte[1024*10];//10k缓冲流 视你内存大小而定咯
    			
    			while(-1!=(len=(new BufferedInputStream(ins)).read(buff))){//长度保存到len,内容放入到 buff
    				out.write(buff, 0, len);//将图片数组内容写入到图片文件
    //				System.out.println(CatchIMG.class.toString()+":"+len+"byte已经写入到文件中,内容:  "+new String(buff));
    			}
    			urlConn.disconnect();
    			ins.close();
    			out.close();
    			System.out.println(CatchIMG.class.toString()+":获取图片完成,耗时="+((System.currentTimeMillis()-startTime)/1000)+"s");
    		}
    	}
    	/**
    	 * @throws IOException  
    	 * @Title: main 
    	 * @Description: 测试方法
    	 * @throws 
    	 */
    	public static void main(String[] args) throws IOException {
    		CatchIMG.getImg("https://files.cnblogs.com/files/humi/wc.bmp");//
    	}
    
    }
    
    

    测试中要获取的图片是这个https://files.cnblogs.com/files/humi/wc.bmp

    最终效果

    imgraber

    *** 一个自己写的java 爬虫基于jsoup和swing技术

  • 相关阅读:
    traceroute tracert 路由器地址 清单 192.168.2.1 网关路由器地址
    /usr/local/nginx/sbin/nginx -s reload 失败原因pid 进程记录和当前不符
    Nginx应用-Location路由反向代理及重写策略 请求转发-URL匹配规则 NGINX Reverse Proxy
    (转载)你好,C++(1)C++是什么?C++的“前世今生”
    (原创)cocos2d-x 3.0 示例代码分析5:testBasic
    (原创)cocos2d-x 3.0 示例代码分析4:VisibleRect
    (原创)cocos2d-x 3.0 示例代码分析3:BaseTest
    (摘要)100个伟大的商业理念:理念35:引爆流行
    (摘要)100个伟大的商业理念:理念34:企业社会责任
    (摘要)100个伟大的商业理念:理念32:重新改造
  • 原文地址:https://www.cnblogs.com/humi/p/7967535.html
Copyright © 2011-2022 走看看