zoukankan      html  css  js  c++  java
  • (五)乱入之如何使用MNIST数据库

    (五)乱入之如何使用MNIST数据库

    今天花了整整一天时间查各种资料,终于搞清楚了怎么使用MNIST数据库。哈哈,MNIST,是不是高端洋气上档次?是不是不知道是什么东东?

    MNIST是一个据说很出名的手写数字数据库,据说是美国中学生手写的数字,说实话大部分都写得挺丑的。。。Anyway,幸好能看得懂是哪个数字。现在课题是用CNN(卷积神经网络)识别这个数据库的数字。我想,CNN还真没懂,不过先搞清楚怎么读入数据库吧,不然空有理论无法实操。一般人会用MATLAB来做神经网络的东东,而我正是一个一般人。当然,非一般的人可能用python之类的高端平台,反正我是不会。。。
    首先上搜索引擎,无论是百度还是google,搜“MNIST”第一个出来的肯定是
    http://yann.lecun.com/exdb/mnist/ 没错,就是它!这个网页上面有四个压缩包的链接,下载下来吧少年!然后别忙着关掉这个网页,因为后面的读取数据还得依靠这个网页的说明。
    下面用其中一个包t10k-images_idx3为例子,写代码说明如何使用这个数据库。
    这是从verysource.com上面下载的源码,赞一个!and再赞一个!
    % Matlab_Read_t10k-images_idx3.m
    % 用于读取MNIST数据集中t10k-images.idx3-ubyte文件并将其转换成bmp格式图片输出。
    % 用法:运行程序,会弹出选择测试图片数据文件t10k-labels.idx1-ubyte路径的对话框和
    % 选择保存测试图片路径的对话框,选择路径后程序自动运行完毕,期间进度条会显示处理进度。
    % 图片以TestImage_00001.bmp~TestImage_10000.bmp的格式保存在指定路径,10000个文件占用空间39M。。
    % 整个程序运行过程需几分钟时间。
    % Written By DXY@HUST IPRAI
    % 2009-2-22
    clear all;
    clc;
    %读取训练图片数据文件
    [FileName,PathName] = uigetfile('*.*','选择测试图片数据文件t10k-images.idx3-ubyte');
    TrainFile = fullfile(PathName,FileName);
    fid = fopen(TrainFile,'r'); %fopen()是最核心的函数,导入文件,‘r’代表读入
    a = fread(fid,16,'uint8'); %这里需要说明的是,包的前十六位是说明信息,从上面提到的那个网页可以看到具体那一位代表什么意义。所以a变量提取出这些信息,并记录下来,方便后面的建立矩阵等动作。
    MagicNum = ((a(1)*256+a(2))*256+a(3))*256+a(4);
    ImageNum = ((a(5)*256+a(6))*256+a(7))*256+a(8);
    ImageRow = ((a(9)*256+a(10))*256+a(11))*256+a(12);
    ImageCol = ((a(13)*256+a(14))*256+a(15))*256+a(16);
    %从上面提到的网页可以理解这四句
    if ((MagicNum~=2051)||(ImageNum~=10000))
        error('不是 MNIST t10k-images.idx3-ubyte 文件!');
        fclose(fid);    
        return;    
    end %排除选择错误的文件。
    savedirectory = uigetdir('','选择测试图片路径:');
    h_w = waitbar(0,'请稍候,处理中>>');
    for i=1:ImageNum
        b = fread(fid,ImageRow*ImageCol,'uint8');   %fread()也是核心的函数之一,b记录下了一副图的数据串。注意这里还是个串,是看不出任何端倪的。
        c = reshape(b,[ImageRow ImageCol]); %亮点来了,reshape重新构成矩阵,终于把串转化过来了。众所周知图片就是矩阵,这里reshape出来的灰度矩阵就是该手写数字的矩阵了。
        d = c'; %转置一下,因为c的数字是横着的。。。
        e = 255-d; %根据灰度理论,0是黑色,255是白色,为了弄成白底黑字就加入了e
        e = uint8(e);
        savepath = fullfile(savedirectory,['TestImage_' num2str(i,'d') '.bmp']);
        imwrite(e,savepath,'bmp'); %最后用imwrite写出图片
        waitbar(i/ImageNum);
    end
    fclose(fid);
    close(h_w);
     
    在选择好的路径中,就有了一大堆MNIST的手写数字的图片。想弄哪个,就用imread()弄它!
    有了这个,相信我的小题目很快有着落了,嘿嘿。
    那么,第五篇,大概,就这样吧。。。
  • 相关阅读:
    Python常用模块之sys
    python操作zip文件
    python的os模块
    [Python模块学习]用qrcode模块生成二维码
    os模块os.walk() 方法和os.path.join()的简单使用
    python操作redis详解
    成员变量和局部变量
    类和对象 引用属性和方法举例
    Java String字符串/==和equals区别,str。toCharAt(),getBytes,indexOf过滤存在字符,trim()/String与StringBuffer多线程安全/StringBuilder单线程—— 14.0
    泛型--面向对象8
  • 原文地址:https://www.cnblogs.com/yymn/p/4579294.html
Copyright © 2011-2022 走看看