先obj_score置信度抑制过滤得分低的box,然后对剩下的做NMS抑制。
NMS抑制时仅仅使用置信得分(这个score = obj_score * cls_score)来排序,依次与类别内置信度高的box做IOU抑制。
NMS流程:
1. 先 分类别 按置信度排序,放到一个集合A中
2. 每一类内,依次跟集合内最大置信度的box进行IOU抑制,大于IOU阈值的从集合A内直接剔除,将最大置信度的box从集合A转移到集合B中
3. 依次对集合A中剩余的box做第2步操作,最终得到的集合B就是本类的预测结果
4. 对所有的类别对应的集合A和B,执行以上操作,得到所有类别的预测结果
import numpy as np def nms(dets, thresh): """Pure Python NMS baseline.""" x1 = dets[:, 0] y1 = dets[:, 1] x2 = dets[:, 2] y2 = dets[:, 3] scores = dets[:, 4] areas = (x2 - x1 + 1) * (y2 - y1 + 1) order = scores.argsort()[::-1] # 置信度从高到低排序 keep = [] while order.size > 0: i = order[0] # 此类别中置信度最高的预测框的索引 keep.append(i) # 将其作为保留下来的第1个预测框 xx1 = np.maximum(x1[i], x1[order[1:]]) yy1 = np.maximum(y1[i], y1[order[1:]]) xx2 = np.minimum(x2[i], x2[order[1:]]) yy2 = np.minimum(y2[i], y2[order[1:]]) w = np.maximum(0.0, xx2 - xx1 + 1) h = np.maximum(0.0, yy2 - yy1 + 1) inter = w * h ovr = inter / (areas[i] + areas[order[1:]] - inter) # 计算其余预测框与置信度最高的预测框的IoU inds = np.where(ovr <= thresh)[0] # 记录下第1个与其Iou<阈值的预测框,也就是与其Iou<阈值的预测框中置信度最高的 order = order[inds + 1] # 将与保留下来的第1个预测框Iou<阈值的预测框中置信度分数最高的预测框作为第2个要保留的 return keep # 所有经过NMS后保留下来的框