zoukankan html css js c++ java

深度学习人脸识别实验---VGG模型

特别说明：本次实验步骤大部分来源于http://blog.csdn.net/wjmishuai/article/details/50658670

1、caffe环境配置

　　主要参考：《深度学习 21天实战Caffe》

2、VGG人脸识别模型资料（提供论文和以及训练完的人脸模型）

　　http://www.robots.ox.ac.uk/~vgg/software/vgg_face/

3、LMDB数据集的获取

数据集划分

#保存图片的路径    
PATH=/media/img  
echo "start..."  
#遍历文件夹  
for name in $PATH/webface_img/*;do  
        var=0  
#遍历文件夹中的图片  
        for file_name in $name/*;do    
            var=$(($var+1));    
            str=$file_name    
            #保存图片路径  
            str=${str#*img}    
            #保存图片lable    
            lable=${str#*/}    
            lable=${lable%%/*}    
            if [ "$var" = "1" ] || [ "$var" = "3" ] || [ "$var" = "5" ]; then    
            #验证集    
            echo $str" "$lable>>/home/gk/val.txt    
            else    
            #测试集    
            echo $str" "$lable>>/home/gk/train.txt    
            fi    
done    
done    
echo "Done."

转换为LMDB格式

#保存生成的lmdb的目录    
EXAMPLE=/media/gk/img
    
#train.txt和val.txt所在的目录  
DATA=/home/gk  
    
#转换图片的工具所在的目录    
TOOLS=/home/gk/caffe-master/build/tools    
    
#图片所在的目录  
TRAIN_DATA_ROOT=/media/gk/img/webface_img  
VAL_DATA_ROOT=/media/gk/img/webface_img  
    
# 设置 RESIZE=true 可以把图片resize成想要的尺寸。  
RESIZE=true  
if $RESIZE; then  
  RESIZE_HEIGHT=227  
  RESIZE_WIDTH=227  
else  
  RESIZE_HEIGHT=0  
  RESIZE_WIDTH=0  
fi  

echo "Creating train lmdb..."  
  
GLOG_logtostderr=1 $TOOLS/convert_imageset   
    --resize_height=$RESIZE_HEIGHT   
    --resize_width=$RESIZE_WIDTH   
    --shuffle   
    $TRAIN_DATA_ROOT   
    $DATA/train.txt   
    $EXAMPLE/train_lmdb  
  
  
echo "Creating val lmdb..."  
  
  
GLOG_logtostderr=1 $TOOLS/convert_imageset   
    --resize_height=$RESIZE_HEIGHT   
    --resize_width=$RESIZE_WIDTH   
    --shuffle   
    $VAL_DATA_ROOT   
    $DATA/val.txt   
    $EXAMPLE/val_lmdb  
  
echo "Done."

4、mean文件，计算图像均值

#lmdb格式的文件所在的路径  
EXAMPLE=/media/gk/img/lmdb_webface  
#均值文件保存的路径  
DATA=/media/gk/44CA719BCA718A46    
#转换图片的工具所在的目录   
TOOLS=/home/gk/caffe-master/build/tools    
    
$TOOLS/compute_image_mean $EXAMPLE/train_lmdb     
  $DATA/mean.binaryproto    
    
echo "Done."

5、模型训练

./build/tools/caffe train --solver=models/bvlc_reference_caffenet/solver.prototxt

主要是训练模型参数文件（slover.prototxt）和网络模型结构配置文件（tarin.prototxt）的编写。

6、模型的测试

参考：

　　http://nbviewer.jupyter.org/github/BVLC/caffe/tree/master/examples/

　　http://blog.csdn.net/wjmishuai/article/details/50854168

主要代码

//模型加载
net=caffe.Classifier('/home/gk/caffe-master/examples/VGG_net/deploy.prototxt',  
    '/home/gk/caffe-master/examples/VGG_net/VGG_face.caffemodel') 

def compar_pic(path1,path2):  
    global net  
    #加载验证图片  
    X=read_image(path1)  
    test_num=np.shape(X)[0]  
    #X  作为 模型的输入  
    out = net.forward_all(data = X)  
    #fc7是模型的输出,也就是特征值  
    feature1 = np.float64(out['fc7'])  
    feature1=np.reshape(feature1,(test_num,4096))  
    #加载注册图片  
    X=read_image(path2)  
    #X  作为 模型的输入  
    out = net.forward_all(data=X)  
    #fc7是模型的输出,也就是特征值  
    feature2 = np.float64(out['fc7'])  
    feature2=np.reshape(feature2,(test_num,4096))  
    #求两个特征向量的cos值,并作为是否相似的依据  
    predicts=pw.cosine_similarity(feature1,feature2)  
    return  predicts  
  
def read_image(filelist):  
  
    averageImg = [129.1863,104.7624,93.5940]  
    X=np.empty((1,3,224,224))  
    word=filelist.split('
')  
    filename=word[0]  
    im1=skimage.io.imread(filename,as_grey=False)  
    #归一化  
    image =skimage.transform.resize(im1,(224, 224))*255  
    X[0,0,:,:]=image[:,:,0]-averageImg[0]  
    X[0,1,:,:]=image[:,:,1]-averageImg[1]  
    X[0,2,:,:]=image[:,:,2]-averageImg[2]  
    return

7、模型的微调

　　参考：http://blog.csdn.net/hlx371240/article/details/51388022　

http://www.cnblogs.com/ddblog/

查看全文

相关阅读:
select在各个浏览器中的兼容性问题
 pc打开手机站提示切换为手机屏幕
 图片预加载
 div盒子水平垂直居中的方法
 如何检测该浏览器为微信浏览器
 小箭头的写法，z-index在ie7显示混乱问题
 微信a标签不跳转
 css font简写规则
 windows环境cmd下执行jar
docker制作镜像步骤

原文地址：https://www.cnblogs.com/ddblog/p/5965119.html