zoukankan      html  css  js  c++  java
  • Windows下Caffe实现图像分类

    前言:最近参加百度点石大赛,完成商家招牌的分类和检测,把实验过程简单记录下来,具体步骤如下。

    环境配置:windows下的visual studio2013和caffe(cpu版本)环境搭建请看我另一篇博客:http://www.cnblogs.com/wmr95/articles/9021748.html

    下面写写具体实验流程:

    1.首先把比赛平台下的数据集下载放到caffe-master路径下data文件夹中,如图:

    首先数据提供的是train和test图片数据及label的txt文件,具体如图所示:

    其中train文件夹下的图片和train.txt中的内容如图:

    2.接下来根据图片和label信息得到lmdb格式文件train_lmdb新建一个create_lmdb.bat 文件,内容为:

    E:caffe-masterBuildx64Releaseconvert_imageset.exe --resize_height=128 --resize_width=128 --shuffle --backend="lmdb" E:caffe-masterdatasignboard	rain E:caffe-masterdatasignboard	rain.txt train_lmdb  
    
    pause

    简单解释一下,第一个显然是你编译好的caffe中的exe工具,第二和第三指定对图像进行resize(因为原图大小尺寸不一),第四个是shuffle参数,随机打乱一下label的txt列表,第六个--backend指定生成lmdb格式(还可以指定为leveldb,另外一种格式),第七个指定train文件夹下的图片,第八个指定train的label信息,最后一个指定得到的train_lmdb(这个不能添加路径,由程序自己创建文件夹,如果提前有这个文件夹会报错)。

    执行成功截图:

    在当前路径下得到train_lmdb文件,如图所示:

    3.根据得到的lmdb格式文件train_lmdb得到均值文件

    新建一个compute_image_mean.bat文件,代码内容为:

    E:caffe-masterBuildx64Releasecompute_image_mean.exe E:caffe-masterdatasignboard	rain_lmdb mean.binaryproto
         
    pause  

    具体意思大概看下就了解,不具体解释了。运行成功截图为:

     在当前路径下得到的mean.binaryproto文件为:

    4.接下来就准备网络模型的事情了(简单举个例子,我这里先采用的是cifar10的网络,接下来以这个为例)

    先将examples下的cifar10拷贝一份命名为signboard,这里主要用到两个prototxt文件:

    train_test.prototxt的内容需要做修改:(mean_file和source需要指定路径,另外我们是进行100分类,最后的output由10改为100)

    这里需要注意,因为我们没有得到test_lmdb文件,这里需要把phase的TEST部分删除,只留下TRAIN部分。

    然后再修改solver.prototxt文件:

    因为训练过程中不包含测试集,所以这里需要把test部分注释,否则会出现“Unknown bottom blob 'data' (layer 'conv1',bottom index 0)”的错误。

    错误截图为:

    5.完成数据处理和网络模型后,就可以进行训练模型了,在caffe-master根目录下新建一个trian_signboard.bat文件,代码内容为:

    .Buildx64Releasecaffe.exe train --solver=.examplessignboardcifar10_quick_solver.prototxt  
    pause

    在caffe-master根目录下执行这个.bat文件就可以训练了,开心的飞起~~训练过程截图为:

    这只是初步的把分类实验跑起来,后期打算做数据增强和finetune操作。期待竞赛有个好成绩~~

  • 相关阅读:
    mysql的多表查询join
    JMeter源码集成到Eclipse
    jmeter关联 正则表达式提取器
    JMeter结果树响应数据中文乱码解决办法
    BZOJ 2080: [Poi2010]Railway 双栈排序
    BZOJ 4384: [POI2015]Trzy wieże
    BZOJ 4325: NOIP2015 斗地主
    BZOJ 1142: [POI2009]Tab
    第10章 内核同步方法
    第1章 Linux内核简介
  • 原文地址:https://www.cnblogs.com/wmr95/p/9022415.html
Copyright © 2011-2022 走看看