zoukankan      html  css  js  c++  java
  • 通过文件头标识判断图片格式

    出自:http://www.cnblogs.com/Wendy_Yu/archive/2011/12/27/2303118.html

      在加载图片的时候,加载失败,后缀都是jpg格式,但换个图片就可以了,为此,怀疑图片格式有问题,遂拖到UE里面查看它的16进制,果然,两个图片的文件头根本就不一样,这不是欺负人嘛,害我白白浪费了半天的时间,差点要重新编译内核。

    图片的格式很多,一个图片文件的后缀名并不能说明这个图片的真正格式什么,那么如何获取图片的格式呢?我想到了几个简单但有效的方法,那就是读取图片文件的文件头标识。我们知道各种格式的图片的文件头标识识不同的,因此我们可以通过判断文件头的标识来识别图片格式。      我对各种格式的图片文件头标识进行了分析,不仅查找资料,也用十六进制编辑器察看过图片的文件头,以下是我收集、分析的结果,供大家参考。
    1.JPEG/JPG - 文件头标识 (2 bytes): $ff, $d8 (SOI) (JPEG 文件标识) - 文件结束标识 (2 bytes): $ff, $d9 (EOI) 
    2.TGA - 未压缩的前5字节   00 00 02 00 00 - RLE压缩的前5字节   00 00 10 00 00
    3.PNG - 文件头标识 (8 bytes)   89 50 4E 47 0D 0A 1A 0A
    4.GIF - 文件头标识 (6 bytes)   47 49 46 38 39(37) 61                         G  I  F  8  9 (7)  a
    5.BMP - 文件头标识 (2 bytes)   42 4D                         B  M
    6.PCX - 文件头标识 (1 bytes)   0A
    7.TIFF - 文件头标识 (2 bytes)  4D 4D 或 49 49
    8.ICO - 文件头标识 (8 bytes)   00 00 01 00 01 00 20 20 
    9.CUR - 文件头标识 (8 bytes)   00 00 02 00 01 00 20 20
    10.IFF - 文件头标识 (4 bytes)   46 4F 52 4D                        F  O  R  M
    11.ANI - 文件头标识 (4 bytes)   52 49 46 46                         R  I  F  F
         根据这些文件头标识的收集,我可以写一个识别图像格式的模块了。但是在写这个模块之前可以对收集到的文件头标识进行优化,使得程序中字符串比对次数尽量的少。 1.JPEG我们知需要比对文件头的$ff, $d8这两个字符,而不用读取最后的两个结束标识了。 2.TGA,ICO,CUR只需比对第三个与第五个字符即可。 3.PNG比对[89][50]这两个字符。 4.GIF比对[47][49][46]与第五个字符。
    废话不多说了,利用内存流来判断文件的格式,其实判断文件的前几个字节就可以简单的判断这个文件是什么类型的文件,例如
    jpg文件 是 FFD8 (从低位到高位就要反过来 D8FF 下面都是一样)
    BMP文件 是 424D ---4D42

    ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

    Mac终端查看文件16进制编码头信息

     

    1. 在命令行中输入hexdump 指定的文件名 | less

    2. 如果你想把这些16进制编码保存到一个文件中,那么可以输hexdump 指定的文件名 > 目标文件
  • 相关阅读:
    Windows下安装tesserocr
    Python中的那些“坑”
    【Python3爬虫】用Python中的队列来写爬虫
    【Python3爬虫】常见反爬虫措施及解决办法(三)
    【Python3爬虫】常见反爬虫措施及解决办法(二)
    【Python3爬虫】常见反爬虫措施及解决办法(一)
    【Python3爬虫】教你怎么利用免费代理搭建代理池
    【Python3爬虫】自动查询天气并实现语音播报
    【Python3爬虫】百度一下,坑死你?
    【Python3爬虫】为什么你的博客没人看呢?
  • 原文地址:https://www.cnblogs.com/lee4519/p/6586649.html
Copyright © 2011-2022 走看看