zoukankan      html  css  js  c++  java
  • java判断文件真实类型

     代码如下:

    import java.io.FileInputStream;
    import java.io.IOException;
    import java.util.HashMap;
    /**
     * <p>
     * 类描述:获取和判断文件头信息
     * |--文件头是位于文件开头的一段承担一定任务的数据,一般都在开头的部分。
     * |--头文件作为一种包含功能函数、数据接口声明的载体文件,用于保存程序的声明(declaration),而定义文件用于保存程序的实现(implementation)。
     * |--为了解决在用户上传文件的时候在服务器端判断文件类型的问题,故用获取文件头的方式,直接读取文件的前几个字节,来判断上传文件是否符合格式。
     */
    public class CheckFileFormatUtil {
        // 缓存文件头信息-文件头信息
        private static final HashMap<String, String> mFileTypes = new HashMap<String, String>();
        static {
            // images
            mFileTypes.put("FFD8FF", "jpg");
            mFileTypes.put("89504E47", "png");
            mFileTypes.put("47494638", "gif");
            mFileTypes.put("49492A00", "tif");
            mFileTypes.put("424D", "bmp");
            //
            mFileTypes.put("41433130", "dwg"); // CAD
            mFileTypes.put("38425053", "psd");
            mFileTypes.put("7B5C727466", "rtf"); // 日记本
            mFileTypes.put("3C3F786D6C", "xml");
            mFileTypes.put("68746D6C3E", "html");
            mFileTypes.put("44656C69766572792D646174653A", "eml"); // 邮件
            mFileTypes.put("D0CF11E0", "doc");
            mFileTypes.put("D0CF11E0", "ppt");
            mFileTypes.put("D0CF11E0", "xls");//excel2003版本文件
            mFileTypes.put("5374616E64617264204A", "mdb");
            mFileTypes.put("252150532D41646F6265", "ps");
            mFileTypes.put("255044462D312E", "pdf");
            mFileTypes.put("504B0304", "pptx");
            mFileTypes.put("504B0304", "docx");
            mFileTypes.put("504B0304", "xlsx");//excel2007以上版本文件
            mFileTypes.put("52617221", "rar");
            mFileTypes.put("57415645", "wav");
            mFileTypes.put("41564920", "avi");
            mFileTypes.put("2E524D46", "rm");
            mFileTypes.put("000001BA", "mpg");
            mFileTypes.put("000001B3", "mpg");
            mFileTypes.put("6D6F6F76", "mov");
            mFileTypes.put("3026B2758E66CF11", "asf");
            mFileTypes.put("4D546864", "mid");
            mFileTypes.put("1F8B08", "gz");
        }
     
        /**
         * @param filePath 文件路径
         * @return 文件头信息
         * @author wlx
         * <p>
         * 方法描述:根据文件路径获取文件头信息
         */
        public static String getFileType(String filePath) {
    //        System.out.println(getFileHeader(filePath));
    //        System.out.println(mFileTypes.get(getFileHeader(filePath)));
            return mFileTypes.get(getFileHeader(filePath));
        }
     
        /**
         * @param filePath 文件路径
         * @return 文件头信息
         * @author wlx
         * <p>
         * 方法描述:根据文件路径获取文件头信息
         */
        public static String getFileHeader(String filePath) {
            FileInputStream is = null;
            String value = null;
            try {
                is = new FileInputStream(filePath);
                byte[] b = new byte[4];
                /*
                 * int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length
                 * 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len)
                 * 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。
                 */
                is.read(b, 0, b.length);
                value = bytesToHexString(b);
            } catch (Exception e) {
                e.printStackTrace();
            } finally {
                if (null != is) {
                    try {
                        is.close();
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                }
            }
            return value;
        }
     
        /**
         * @param src 要读取文件头信息的文件的byte数组
         * @return 文件头信息
         * @author wlx
         * <p>
         * 方法描述:将要读取文件头信息的文件的byte数组转换成string类型表示
         */
        private static String bytesToHexString(byte[] src) {
            StringBuilder builder = new StringBuilder();
            if (src == null || src.length <= 0) {
                return null;
            }
            String hv;
            for (byte aSrc : src) {
                // 以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式,并转换为大写
                hv = Integer.toHexString(aSrc & 0xFF).toUpperCase();
                if (hv.length() < 2) {
                    builder.append(0);
                }
                builder.append(hv);
            }
    //        System.out.println(builder.toString());
            return builder.toString();
        }
    
        public static void main(String[] args) throws Exception {
            final String fileType = getFileType("E:\项目管理清单.xlsx");
            System.out.println(fileType);
            System.out.println(getFileHeader("E:\项目管理清单.xlsx"));
        }
    }
    View Code

    附录:魔数简介

    很多类型的文件,其起始的几个字节的内容是固定的(或是有意填充,或是本就如此)。
    根据这几个字节的内容就可以确定文件类型,因此这几个字节的内容被称为魔数 (magic number)。

    JPEG                             jpg;jpeg                      0xFFD8FF
    PNG                              png                           0x89504E470D0A1A0A
    GIF                              gif                           GIF8
    TIFF                             tif;tiff                      0x49492A00
    TIFF                             tif;tiff                      0x4D4D002A
    AOL ART                          art                           0x4A47040E000000
    AOL ART                          art                           0x4A47030E000000
    PC Paintbrush                    pcx                           0x0A050108
    Graphics Metafile                wmf                           0xD7CDC69A
    Graphics Metafile                wmf                           0x01000900
    Graphics Metafile                wmf                           0x02000900
    Enhanced Metafile                emf                           0x0100000058000000
    CAD                              dwg                           0x41433130
    Outlook Express                  dbx                           0xCFAD12FE
    MS Office/OLE2     doc;xls;dot;ppt;xla;ppa;pps;pot;msi;sdw;db  0xD0CF11E0A1B11AE1
    WordPerfect                      wpd                           0xFF575043
    Quicken                          qdf                           0xAC9EBD8F
    QuickBooks Backup                qbb                           0x458600000600
    Sage               sly.or.srt.or.slt;sly;srt;slt               0x53520100
    Lotus WordPro v9                 lwp                           0x576F726450726F
    Lotus 123 v9                     123                           0x00001A00051004
    Lotus 123 v5                     wk4                           0x00001A0002100400
    Lotus 123 v3                     wk3                           0x00001A0000100400
    Lotus 123 v1                     wk1                           0x2000604060
    Windows Password                 pwl                           0xE3828596
    ZIP Archive                      zip;jar                       0x504B0304
    ZIP Archive (outdated)           zip                           0x504B3030
    GZ Archive                       gz;tgz                        0x1F8B08
    ARJ Archive                      arj                           0x60EA
    MPEG                             mpg;mpeg                      0x000001BA
    MPEG                             mpg;mpeg                      0x000001B3
    Windows Media                    asf                           0x3026B2758E66CF11
    ELF Executable                   elf;;                         0x7F454C4601010100 
    Java-Class                      class                          0xCAFEBABE

  • 相关阅读:
    定时清理日志的shell脚本
    图解 Elestricsearch 写入流程
    消息队列产生严重消息堆积怎么处理?
    消息队列如何确保消息的有序性?
    架构模式 CQRS
    消息队列把消息弄丢了怎么办?
    3 个主流 Java 微服务框架
    RabbitMQ、Kafka、RocketMQ 是如何实现高可用的?
    Kafka 不再需要 ZooKeeper
    微服务设计原则
  • 原文地址:https://www.cnblogs.com/xiaoliu66007/p/11359545.html
Copyright © 2011-2022 走看看