JSOUP如何优秀的下载JPEG等二进制图像

zoukankan html css js c++ java

JSOUP如何优秀的下载JPEG等二进制图像
【本文版权归微信公众号"代码艺术"（ID：onblog）所有，若是转载请务必保留本段原创声明，违者必究。若是文章有不足之处，欢迎关注微信公众号私信与我进行交流！】

引言
- JSOUP默认是不支持解析JPEG等二进制图像的，解决方法也很简单，只需要加上Jsoup.ignoreContentType(true)这一行代码就可以。关于这一点的原因，来看看官方API说明。
- Connection (jsoup Java HTML Parser 1.11.3 API)
解释
- 连接ignoreContentType(boolean ignoreContentType) 在解析响应时忽略文档的内容类型。默认情况下，这是错误的，未识别的内容类型将导致抛出IOException。(例如，通过尝试解析JPEG二进制映像来防止产生垃圾)。设置为true以强制执行解析尝试，而不考虑内容类型。
- 参数: ignoreContentType—如果您想要将响应解析为文档时忽略的内容类型设置为true。
- 返回: 这个连接,链接
完整示例

这个示例是完整下载一张图片的所有步骤。
```
@Test
public void test() throws IOException {
    Response response = Jsoup.connect("http://sjbz.fd.zol-img.com.cn/t_s640x960c/g5/M00/0F/09/ChMkJlfJQcWIDXJEAAN5CfxwAOYAAU7hwBVxTQAA3kh337.jpg")
            .ignoreContentType(true)
            .method(Method.GET)
            .execute();
    byte[] bytes = response.bodyAsBytes();
    File file = new File("D:\img.png");
    FileOutputStream fileOutputStream = new FileOutputStream(file);
    fileOutputStream.write(bytes);
    fileOutputStream.flush();
    fileOutputStream.close();
}
```
上面的方法很简单，但是我并不推荐使用。
原因：

我们有必要知道不带缓冲的操作，每读一个字节就要写入一个字节，由于涉及磁盘的IO操作相比内存的操作要慢很多，所以不带缓冲的流效率很低。带缓冲的流，可以一次读很多字节，但不向磁盘中写入，只是先放到内存里。等凑够了缓冲区大小的时候一次性写入磁盘，这种方式可以减少磁盘操作次数，速度就会提高很多！
完美方案

【本文版权归微信公众号"代码艺术"（ID：onblog）所有，若是转载请务必保留本段原创声明，违者必究。若是文章有不足之处，欢迎关注微信公众号私信与我进行交流！】
```
@Test
public void test() throws IOException {
    Response response = Jsoup.connect("http://sjbz.fd.zol-img.com.cn/t_s640x960c/g5/M00/0F/09/ChMkJlfJQcWIDXJEAAN5CfxwAOYAAU7hwBVxTQAA3kh337.jpg")
            .ignoreContentType(true)
            .method(Method.GET)
            .execute();
    //声明缓冲字节输入流
    BufferedInputStream bufferedInputStream = response.bodyStream();
    //缓冲字节输出流-》文件字节输出流-》文件
    File file = new File("D:\img.png");
    FileOutputStream fileOutputStream = new FileOutputStream(file);
    BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(fileOutputStream);
    //把缓冲字节输入流写入到输出流
    byte[] b = new byte[1024]; //每次最多读1KB的大小
    int length; //实际读入的字节
    while ((length = bufferedInputStream.read(b))!=-1){
        //写入到输出流
        bufferedOutputStream.write(b,0,length);
    }
    //刷新缓冲的输出流。这将强制将任何缓冲的输出字节写入底层输出流。
    bufferedOutputStream.flush();
    bufferedInputStream.close();
}
```
版权声明

【本文版权归微信公众号"代码艺术"（ID：onblog）所有，若是转载请务必保留本段原创声明，违者必究。若是文章有不足之处，欢迎关注微信公众号私信与我进行交流！】
查看全文

相关阅读:
压缩和还原压缩的JS代码
 1.3（Spring学习笔记）Spring-AOP
软件配置篇-MySQL下载及安装
 软件配置篇-java下载及安装
 1.2（Spring学习笔记）Spring中的Bean
1.1（Spring学习笔记）Spring基础（BeanFactory、ApplicationContext 、依赖注入）
1.6（学习笔记）EL表达式
 1.5 JSP标准标签库（JSTL）(核心标签 out、set、remove、if、choose、forEach、forTokens、redirect)
1.4(学习笔记)JSP自定义标签
 随机算式

原文地址：https://www.cnblogs.com/onblog/p/13043455.html

JSOUP如何优秀的下载JPEG等二进制图像

引言

解释

完整示例

完美方案

版权声明