tf.image.non_max_suppression()

zoukankan html css js c++ java

tf.image.non_max_suppression()

tf.image.non_max_suppression()

2018年08月17日 15:34:51 爱抠脚的coder 阅读数：1753

贪婪算法：其实就是按scores由大到小排序，然后选定第一个，一次对之后的做iou ，删除那些和选定的框iou大于阈值的框，循环完第一个，再选定之后的一个，再对它后面的框做iou，循环操作。选出最后剩余的框。选定的框不会超过设定的最大值。依次删除最小的。

在吴恩达老师深度学习yolo算法实现自动驾驶的编程题中出现了这个函数，这个函数的功能是在检测算法中我们的一个目标被检测了多次，如何排除掉多余的边界框。比如下面的图，来自于编程题中的图片，下面的这个车被多次检测到，存在多个边界框，保留概率最大的那个，去除掉与这个概率最大的边界框的IoU大于一个阙值的其余边界框。这个过程就成为非最大值抑制=NMS

函数原型：

tf.image.non_max_suppression( boxes, scores, max_output_size, iou_threshold=0.5, score_threshold=float('-inf'), name=None )

按照参数scores的降序贪婪的选择边界框的子集。

删除掉那些与之前的选择的边框具有很高的IOU的边框。边框是以[y1,x1,y2,x2],(y1,x1)和(y2,x2)是边框的对角坐标，当然也可以提供被归一化的坐标。返回的是被选中的那些留下来的边框在参数boxes里面的下标位置。那么你可以使用tf.gather的操作或者利用keras.backend的gather函数来从参数boxes来获取选中的边框。

例如：

selected_indices=tf.image.non_max_suppression(boxes,scores,max_output_size,iou_thresholde)

selected_boxes=tf.gather(boxes,selected_indices)

参数：boxes:2-D的float类型的，大小为[num_boxes,4]的张量；

scores：1-D的float类型的大小为[num_boxes]代表上面boxes的每一行，对应的每一个box的一个score；

max_output_size:一个整数张量，代表我最多可以利用NMS选中多少个边框；

iou_threshold:一个浮点数，IOU阙值展示的是否与选中的那个边框具有较大的重叠度；

score_threshold:一个浮点数，来决定上面时候删除这个边框

name:可选

返回的是selected_indices:表示的是一个1-D的整数张量，大小为[M]，代表的是选出来的留下来的边框下标，M小于等于max_outpuy_size.

例子：

查看全文

相关阅读:
@字节跳动8年老Android面试官谈；Context都没弄明白凭什么拿高薪？
@阿里面试官：Android面试这些原理都给我讲明白了，最低都是20k起步！
@以后面试官再问你三次握手和四次挥手，直接把这一篇文章丢给他
 @备战2020年金三银四，看这一篇面试文章就够了（合适各级Java人员）
字节跳动面试，第三面挂了，这原因我服了！
太可惜了，四面字节跳动，我的offer竟被一道“算法题”给拦截了
 @java2019面试题北京
 @2019.07 Android 面试真题集锦
 2018 Java线程热门面试题，你知道多少？
阿里大厂的148道核心面试题，（程序员必备学习方向）offer收割机全会月薪50k不难

原文地址：https://www.cnblogs.com/fujian-code/p/10408590.html