计算机视觉之非极大值抑制(NMS)以及各种变形

it2025-11-03  3

NMS:Non-Maximum Suppression

NMS,称为非极大值抑制,是目标检测框架中的后处理模块,主要用于删除高度冗余的bbox。 在目标检测的过程中,对于每个obj在检测的时候回产生多个bbox,NMS的本质就是对每个obj的多个bbox去冗余,得到最终的检测结果。

对于检测任务,NMS是一个必需的部件,其为对检测结果进行冗余去除操作的后处理算法。标准的NMS为手工设计的,基于一个固定的距离阈值进行贪婪聚类,(greedily accepting local maxima and discarding their neighbours)即贪婪地选取得分高的检测结果并删除那些超过阈值的相邻结果,使得在recall和precision之间取得权衡。之前的相关工作大多都是利用NMS作为后处理操作。

Soft-NMS:Improving Object Detection With One Line of Code

不同于在NMS中采用单一阈值,对与最大得分检测结果M超过阈值的结果进行抑制,其主要考虑Soft-NMS,对所有目标的检测得分以相应overlap with M的连续函数进行衰减。其伪代码如下: ConvNMS:A Convnet for Non-maximum Suppression 其主要考虑IoU阈值设定得高一些,则可能抑制得不够充分,而将IoU阈值设定得低一些,又可能多个ture positive被merge到一起。其设计一个卷积网络组合具有不用overlap阈值的greedyNMS的结果,通过学习的方法来获得最佳的输出。其基础框架如下:

Pure NMS Network :Learning non-maximum suppression

考虑目标间具有高遮挡的密集场景,其提出一个新的网络架构来执行NMS。经分析,检测器对于每个目标仅产生一个检测结果有两个关键点是必要的,一个是loss惩罚double detections以告诉检测器我们对于每个目标仅需一个检测结果,二是相邻检测结果的joint processing以使得检测器具有必要的信息来分辨一个目标是否被多次检测。论文中提出Gnet,其为第一个“pure”NMS网络。Gnet图如下: Yes-Net: An effective Detector Based on Global Information

不同于NMS,其主要有两个缺点,一是阈值必须人工设定,而在固定阈值下选择所有目标的输出边框是很难的,二是当检测器利用NMS时其假设输出边框都是独立的,但这些边框很可能是共享一些逻辑关系的。因此考虑利用RNN作为滤波器以得到最好的检测边框,其能提升检测器泛化能力。

最新回复(0)