zoukankan      html  css  js  c++  java
  • (五)乱入之如何使用MNIST数据库

    (五)乱入之如何使用MNIST数据库

    今天花了整整一天时间查各种资料,终于搞清楚了怎么使用MNIST数据库。哈哈,MNIST,是不是高端洋气上档次?是不是不知道是什么东东?

    MNIST是一个据说很出名的手写数字数据库,据说是美国中学生手写的数字,说实话大部分都写得挺丑的。。。Anyway,幸好能看得懂是哪个数字。现在课题是用CNN(卷积神经网络)识别这个数据库的数字。我想,CNN还真没懂,不过先搞清楚怎么读入数据库吧,不然空有理论无法实操。一般人会用MATLAB来做神经网络的东东,而我正是一个一般人。当然,非一般的人可能用python之类的高端平台,反正我是不会。。。
    首先上搜索引擎,无论是百度还是google,搜“MNIST”第一个出来的肯定是
    http://yann.lecun.com/exdb/mnist/ 没错,就是它!这个网页上面有四个压缩包的链接,下载下来吧少年!然后别忙着关掉这个网页,因为后面的读取数据还得依靠这个网页的说明。
    下面用其中一个包t10k-images_idx3为例子,写代码说明如何使用这个数据库。
    这是从verysource.com上面下载的源码,赞一个!and再赞一个!
    % Matlab_Read_t10k-images_idx3.m
    % 用于读取MNIST数据集中t10k-images.idx3-ubyte文件并将其转换成bmp格式图片输出。
    % 用法:运行程序,会弹出选择测试图片数据文件t10k-labels.idx1-ubyte路径的对话框和
    % 选择保存测试图片路径的对话框,选择路径后程序自动运行完毕,期间进度条会显示处理进度。
    % 图片以TestImage_00001.bmp~TestImage_10000.bmp的格式保存在指定路径,10000个文件占用空间39M。。
    % 整个程序运行过程需几分钟时间。
    % Written By DXY@HUST IPRAI
    % 2009-2-22
    clear all;
    clc;
    %读取训练图片数据文件
    [FileName,PathName] = uigetfile('*.*','选择测试图片数据文件t10k-images.idx3-ubyte');
    TrainFile = fullfile(PathName,FileName);
    fid = fopen(TrainFile,'r'); %fopen()是最核心的函数,导入文件,‘r’代表读入
    a = fread(fid,16,'uint8'); %这里需要说明的是,包的前十六位是说明信息,从上面提到的那个网页可以看到具体那一位代表什么意义。所以a变量提取出这些信息,并记录下来,方便后面的建立矩阵等动作。
    MagicNum = ((a(1)*256+a(2))*256+a(3))*256+a(4);
    ImageNum = ((a(5)*256+a(6))*256+a(7))*256+a(8);
    ImageRow = ((a(9)*256+a(10))*256+a(11))*256+a(12);
    ImageCol = ((a(13)*256+a(14))*256+a(15))*256+a(16);
    %从上面提到的网页可以理解这四句
    if ((MagicNum~=2051)||(ImageNum~=10000))
        error('不是 MNIST t10k-images.idx3-ubyte 文件!');
        fclose(fid);    
        return;    
    end %排除选择错误的文件。
    savedirectory = uigetdir('','选择测试图片路径:');
    h_w = waitbar(0,'请稍候,处理中>>');
    for i=1:ImageNum
        b = fread(fid,ImageRow*ImageCol,'uint8');   %fread()也是核心的函数之一,b记录下了一副图的数据串。注意这里还是个串,是看不出任何端倪的。
        c = reshape(b,[ImageRow ImageCol]); %亮点来了,reshape重新构成矩阵,终于把串转化过来了。众所周知图片就是矩阵,这里reshape出来的灰度矩阵就是该手写数字的矩阵了。
        d = c'; %转置一下,因为c的数字是横着的。。。
        e = 255-d; %根据灰度理论,0是黑色,255是白色,为了弄成白底黑字就加入了e
        e = uint8(e);
        savepath = fullfile(savedirectory,['TestImage_' num2str(i,'d') '.bmp']);
        imwrite(e,savepath,'bmp'); %最后用imwrite写出图片
        waitbar(i/ImageNum);
    end
    fclose(fid);
    close(h_w);
     
    在选择好的路径中,就有了一大堆MNIST的手写数字的图片。想弄哪个,就用imread()弄它!
    有了这个,相信我的小题目很快有着落了,嘿嘿。
    那么,第五篇,大概,就这样吧。。。
  • 相关阅读:
    淘宝nginx的学习使用,安装及反向代理,负载均衡
    Linux5
    Linux4
    Linux权限相关及yum源的配置
    linux基本命令及python3的环境配置
    使用Guava RateLimiter限流
    Runnable与Callable 区别
    [Kafka] 如何保证消息不丢失
    [多线程] 等待所有任务执行完成
    [Docker] 快速安装mysql
  • 原文地址:https://www.cnblogs.com/yymn/p/4579294.html
Copyright © 2011-2022 走看看