作者:王先荣
前言
今天在使用cvCalcEMD2函数计算两个直方图的最小工作距离时,对于2维和3维的直方图,总是出现“内存不足”的异常。通过分析OpenCv的源代码,发现了其中的蹊跷,现记录如下。
结论
先把结论写出来,对于不喜欢探究的人可以节省不少时间。理论上,cvCalcEMD2能计算的最大直方图签名的行数为15440。
分析过程
1.在cvemd.cpp中,函数cvCalcEMD2的第186行,会用以下两句来暂存直方图签名的行数:
size1 = signature1->rows;
size2 = signature2->rows;
size1和size2分别为2个直方图对应签名的行数。
2.在cvemd.cpp中,函数icvInitEMD的第354行,计算缓冲区的大小
buffer_size = (size1+1) * (size2+1) * (sizeof( float ) + /* cost */
sizeof( char ) + /* is_x */
sizeof( float )) + /* delta matrix */
(size1 + size2 + 2) * (sizeof( CvNode2D ) + /* _x */
sizeof( CvNode2D * ) + /* cols_x & rows_x */
sizeof( CvNode1D ) + /* u & v */
sizeof( float ) + /* s & d */
sizeof( int ) + sizeof(CvNode2D*)) + /* idx1 & idx2 */
(size1+1) * (sizeof( float * ) + sizeof( char * ) + /* rows pointers for */
sizeof( float * )) + 256; /* cost, is_x and delta */
为了简化计算,假设需要比较的两个直方图维数相同,记size1=size2=s,那么可以得到以下等式:
buffer_size=
(s+1)*(s+1)*(4+1+4) +
(s+s+2)*(20+4+8+4+4+4) +
(s+1)*(4+4+4)+256
=
(9*s^2+18*s+9) +
(88*s+88) +
(12*s+12)+256
=9*s^2 + 118*s + 365
在32位系统中,malloc函数分配的最大内存数目为2G(即2,147,483,648)。
解方程: 9*s^2 + 118*s - 2,147,483,283 = 0
得到结果:15,440
详细结论
(1)理论上,直方图签名的行数最多不能超过15440;
(2)对于1维直方图,区间数目不能超过15440;
(3)对于2维直方图,2个区间数目的乘积不能超过15440,区间相同的话每个区间不能超过124;
(4)对于3维直方图,3个区间数目的乘积不能超过15440,区间相同的话每个区间不能超过24.9;
(5)实际使用的时候,因为同一个程序中的其他部分还要占用内存,所以会比计算的值更少。
希望本文对您有所帮助。