BirdNet 论文解读
核心思想:
Detection Framework:
第一步:将三维点云信息处理成2D的鸟瞰图。
第二步:利用处理图像的卷积神经网络鸟瞰图,得到位置,朝向,类别等2D信息。
第三步:进行3D Object Oriented Detection,对高度进行计算。
网络框架:
第一步:将3维点云信息投影成3-channel BEV map.
第二步:利用faster-rcnn检测网络,输出class, 2d bounding box, yaw angle.
第三步:2d detection refinement;输入ground estimation, 输出高度,完成3d检测。
具体内容
BEV Generation
- maximum height
- mean intensity
- the density of points in each cell, which is computed as the number of points in that cell, divided by
the maximum possible number of points.
相应的产生一个与BEV map相同尺寸的normalization map.以此来平衡不同lidar在水平,竖直分辨率不同的问题。
Inference Framework
- Faster rcnn
Post-processing
2D detection refinement process
将第二步粗糙的回归精细化。
高度计算
BEV里面的最高点减去经过处理后的最低点。
感觉这样好草率。