zoukankan      html  css  js  c++  java
  • caffe blob理解

      

    blob数据结构是caffe中基本的数据存储单元,它主要存储的数据是网络中的中间数据变量,比如各层的输入和输出;代价函数关于网络各层参数的梯度。

    blob中除了存储数据外,还有一些标记数据的参数,以下就是一些blob中的数据成员:

    protected:  
      shared_ptr<SyncedMemory> data_;  
      shared_ptr<SyncedMemory> diff_;  
      shared_ptr<SyncedMemory> shape_data_;  
      vector<int> shape_;  
      int count_;  
      int capacity_

    data_:表示网络各层的输入和输出;

    diff_:表示代价函数相对于各层参数的梯度;

    shape_:是一个可变数组,shape_中主要存储4个变量:num表示一个batch中的样本数量,从这我们可以看出Blob的存储是以batch为基本单位的;channels表示对应层的通道,比如卷积层有20个卷积核,channels的值就是20;height和width就表示单个数据的尺寸,可能是一副图像的尺寸,也可能表示卷积核的尺寸,在每一层所代表的含义也不相同。

    count_:表示这个Blob里已经存储的元素的个数;

    capacity_:表示这个Blob的容量;

    Blob同时保存了data_和diff_,其类型为SyncedMemory的指针,注意是指针。

    Blob中除了数据成员之外,也有很多用于操作数据的函数成员,下面就说几个比较重要的:

        void Blob<Dtype>::Reshape():这个函数是在原来分配的内存不够的情况下重新分配内存。

        const Dtype* Blob<Dtype>::cpu_data():这个是获取Blob结构体中的data_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

        const Dtype* Blob<Dtype>::cpu_diff():这个是获取Blob结构体中的diff_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

        Dtype* Blob<Dtype>::mutable_cpu_data():获取Blob结构体中的data_数据的指针,同时可以对指针指向的内容更改。

        Dtype* Blob<Dtype>::mutable_cpu_diff():获取Blob结构体中的diff_数据的指针,同时可以对指针指向的内容更改。

        void Blob<Dtype>::ShareData(const Blob& other):让其他Blob的data_数据和当前Blob共享。

        void Blob<Dtype>::ShareDiff(const Blob& other):让其他Blob的diff_和当前的Blob共享。   

    在blob.hpp中还有这样几个定义:

    按照注释的意思,这几个函数和shape()是一样的作用。shape本身是一个vector,这个vector的size为4,第一个位置存储图片的个数,第二个存储channel的个数,以此类推。

    逻辑上看,blob是一个四维数组。但实际上,因为数组的存储是在内存中开辟一块连续的、大小相同的的空间,所以blob的存储应该是一个一维的存储结构。只不过是利用四个参数来进行寻址(shape_里的四个参数)。并且blob是行优先的存储方式。

    所以对于一个(n, k, h, w)的blob,他的维度就是n*k*h*w,在(n, k, h, w)位置的值物理位置为((n * K + k) * H + h) * W + w。

    以Blob中二维矩阵为例(如全连接网络shape (N, D)),如图所示。同样的存储方式可以推广到多维。

     

    动态多维数组:Blob 类可以动态改变数组的尺寸,当拓展数组导致原有内存空间不足以存放下数据时 (count > capacity),就会重新分配内存。Blob 提供了一组 Reshape 函数来完成这个功能。

    void Reshape(const int num, const int channels, const int height, const int width); // Deprecated
    void Reshape(const vector<int>& shape);
    void Reshape(const BlobShape& shape);
    void ReshapeLike(const Blob& other);
    

     Blob 类在初始化时并没有分配内存,也是通过调用 Reshape 来分配内存的。

    template <typename Dtype>
    void Blob<Dtype>::Reshape(const vector<int>& shape) {
      CHECK_LE(shape.size(), kMaxBlobAxes); // 检查维数
      count_ = 1; // 用于计算新的多维数组的大小
      shape_.resize(shape.size()); // 更新维数
      if (!shape_data_ || shape_data_->size() < shape.size() * sizeof(int)) {
        // shape_data_ 未初始化或者内存太小
        shape_data_.reset(new SyncedMemory(shape.size() * sizeof(int)));
      }
      int* shape_data = static_cast<int*>(shape_data_->mutable_cpu_data());
      for (int i = 0; i < shape.size(); ++i) {
        CHECK_GE(shape[i], 0);
        CHECK_LE(shape[i], INT_MAX / count_) << "blob size exceeds INT_MAX";
        count_ *= shape[i];
        shape_[i] = shape[i];
        shape_data[i] = shape[i];
      }
      if (count_ > capacity_) {
        // 内存不够
        capacity_ = count_;
        data_.reset(new SyncedMemory(capacity_ * sizeof(Dtype)));
        diff_.reset(new SyncedMemory(capacity_ * sizeof(Dtype)));
      }
    }

    http://blog.csdn.net/qq_14975217/article/details/51524042

    http://blog.csdn.net/mounty_fsc/article/details/51085654

    http://blog.csdn.net/buyi_shizi/article/details/51506853

     http://blog.csdn.net/jyl1999xxxx/article/details/53981813

  • 相关阅读:
    数论笔记
    微积分笔记
    洛谷P3835 【模板】可持久化平衡树
    洛谷P3385 【模板】负环
    洛谷 P3379 【模板】最近公共祖先(LCA)
    洛谷P3386 【模板】二分图匹配
    洛谷P3388 【模板】割点(割顶)
    洛谷P3373 【模板】线段树 2
    洛谷P3372 【模板】线段树 1
    Linux(CentOS 6.5) 下安装MySql 5.7.18 二进制版本粗浅攻略
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/7799731.html
Copyright © 2011-2022 走看看