简化非极大值抑制分析

《中国科学技术大学学报》2016年第一期

摘要:

以简化非极大值抑制为代表的后处理在基于滑动窗口法的目标检测中发挥着重要作用.针对传统简化非极大值抑制约束条件单一、消除重复检测不充分的问题,提出了一种改进的简化非极大值抑制,即在传统简化非极大值抑制仅计算交集面积对候选检测边界框的覆盖比例的基础上,增加“抑制完全覆盖检测”约束和“PASCALVOC重叠判据”约束,分别对应计算交集面积对选中检测边界框的覆盖比例和对并集面积的重叠比例.实验结果表明,该改进的简化非极大值抑制能有效消除误检,显著提升目标检测方法性能.

关键词:

目标检测;后处理;简化非极大值抑制;抑制完全覆盖检测;PASCALVOC重叠判据

目标检测是计算机视觉领域最基本的挑战之一,广泛应用在工业、医学、***事、教育、商业、体育等领域[1].滑动窗口法是目标检测方法中的主流方法[2],虽然在***像的尺度空间中稠密地滑动窗口可以有效地避免漏检,但是也带来了一个重要的难题:目标周围会产生大量覆盖目标整体或部分的彼此邻近的窗口,分类器有很大可能将这些窗口分类为包含目标,从而导致对目标重复检测,发生很多误检.正是为了处理这种情况,基于滑动窗口法的目标检测方法中通常包括一个后处理的步骤.Viola等在做人脸检测研究时提出维奥拉-琼斯目标检测框架[3],该框架是第一种可以实时处理并给出很好检测率的目标检测方法.本文采用后处理方法解决重复检测问题.首先,如果两个检测结果的边界框有交叠,那么将它们划分到同一个子集,根据此规则将所有检测结果划分到互不相交的子集中;然后,计算子集内所有检测结果边界框的平均值,得出一个最终的检测区域.这样,每一个子集都有一个唯一的检测结果,大大减少了误检的数量.目前,非极大值抑制(non-maximumsuppression,NMS)是应用最为广泛的一类后处理方法,C4行人检测器等诸多目标检测方法[5-9]均采用NMS以消除重复检测.文献[4]将NMS阐述为局部极大值搜索(localmaximumsearch,LMS),即通过LMS获得超越所有相邻者的局部极大值,然后抑制其他局部非极大值.NMS又分mean-shiftNMS、简化NMS等.Mean-ShiftNMS[6]是一种较好的NMS方法,但是在运用过程中,Mean-ShiftNMS需要设置很多的参数.这些参数严重依赖检测方法的其他方面因素,如滑动窗口步长等;因此,大多数研究人员选择采用简洁而实用的简化非极大值抑制.Dollár等[7]在完整的***像中检测目标时,在***像多尺度空间中采用滑动窗口法,其中滑动窗口步长为4个像素,尺度步长为21/10.文中作者用到的简化NMS只有一个参数,即重叠率阈值,并将其设置为0.6;同样地,Enzweiler等在文献[8]中将简化非极大值抑制的重叠率阈值设为0.5.在可变形部位模型(deformablepartmodels,DPM)目标检测方法[9]中,Felzenszwalb等较详细地描述了简化非极大值抑制的过程:首先分类器对***片完成检测后,获得检测结果集合D,其中每一个元素由1个检测边界框和相应的分类器得分构成;然后严格按分类器得分对集合D排序,选中得分最高的检测结果,依次计算该检测边界框对得分较低的候选边界框的覆盖比例,丢弃覆盖超过50%的候选边界框;再更新检测结果并排序,重复上一个步骤,最终选择出所有符合要求的边界框.由于传统的简化非极大值抑制方法存在约束条件单一、消除误检不充分的问题,本文在传统的简化非极大值抑制基础上,增加两条辅助约束条件,提出一种改进的简化非极大值抑制.

1简化非极大值抑制的一般化讨论

本节首先对传统的简化非极大值抑制展开一般化的讨论,然后以DPM目标检测方法在INRIAPerson测试集上检测行人目标为例,分析传统的简化非极大值抑制的不足.

1.1传统的简化非极大值抑制Felzenszwalb等[9]认为简化非极大值抑制是一种“贪婪”的方法,这里的“贪婪”体现在它总是优先选择分类器得分高的检测结果.一旦候选边界框与已经被选中的边界框触发简化非极大值抑制的约束条件,总是分类器得分低的候选边界框被丢弃。

1.2简化非极大值抑制的不足简化非极大值抑制后处理方法非常简洁,但是也存在明显不足.如***1所示,DPM目标检测方法在INRIAPerson测试集上检测行人目标时,存在很多类似***1中展示的误检.

2改进的简化非极大值抑制

传统的简化非极大值抑制凭借简洁实用的优点得到了广泛应用,然而单一约束条件严重限制了后处理的效果.本节提出了两条改进的约束条件,可以有效解决传统简化非极大值抑制的不足,显著提升目标检测方法的性能.

2.1“抑制完全覆盖检测”约束我们观察到一个频繁出现的现象,如***1所示.尺寸大的误检边界框往往将小的检测边界框完全覆盖.受此启发,我们提出“抑制完全覆盖检测”约束:如果分类器得分低的候选检测边界框将已经选中的边界框完全覆盖,则丢弃该候选检测结果.

2.2“PASCALVOC重叠判据”约束为了解决“抑制完全覆盖检测”约束的不足,我们继续提出“PASCALVOC重叠判据”约束,这个约束条件源于PASCALVOC目标检测评价方法,约束也由此得名.PASCALVOC挑战赛[10]对于是否检测到目标的评价方法,即所谓PASCALVOC重叠判据,是通过计算检测结果边界框与标注真实值(groundtruth)边界框的重叠率,如公式(2)所示.当检测结果边界框Bp与标注真实值边界框Bgt的交集面积与其并集面积的比值超过阈值50%时,检测结果Bp视为正确检测到目标.

3实验结果分析

验证实验采用DPM在INRIAPerson数据集上训练得到的行人混合模型,如***4所示.该混合模型共有2个组件模型,每个组件模型分别包含8个可变形部位.INRIAPerson测试集由288张正样本测试***片组成,共包含589个目标.我们利用该模型在INRIAPerson测试集上检测行人目标.用传统的简化非极大值抑制对检测结果后处理时,存在大量分类器得分低且尺寸较大的边界框,原始约束条件在边界框交集面积覆盖大边界框的比例小于设置阈值时失效,产生大量如***1中所示的误检.本文新增的两条约束条件有效抑制了这些误检,故而更好地发掘出检测方法的性能.同时,这种改进的简化非极大值抑制仅在原始方法的约束条件处增加了两条“或”判断条件,未改变算法的计算复杂度.需要指出的是,我们在实验过程中有两点发现:①INRIA在标注真实值时,忽略了很多部分遮挡的目标,而基于部位的目标检测方法,如DPM等可能检测到正确却没有标注的目标,如***6所示,从而导致检测方法“被误检”,影响检测方法的性能评价;②INRIAPerson数据集标注了一些尺寸较小的目标,检测方法很容易漏检这些目标,如***7所示,给DPM等目标检测方法提出了挑战.

4结论

后处理在基于滑动窗口法的目标检测方法中不可或缺,然而,简化非极大值抑制作为一种典型的后处理方法,由于约束条件单一存在消除误检不充分的问题.本文对简化非极大值抑制的约束条件进行了补充,在传统简化非极大值抑制的基础上引入两条附加约束———“抑制完全覆盖检测”约束和“PASCALVOC重叠判据”约束,并对各约束条件进行了一般化的分析.实验结果表明,采用改进的简化非极大值抑制可以有效减少误检,显著提升检测方法的性能.这种改进的简化非极大值抑制后处理适用于所有基于滑动窗口法的目标检测方法.与传统的简化非极大值抑制一样,改进的简化非极大值抑制也面临阈值选择问题,针对INRIAPerson数据集我们提供的对比实验阈值方案是(0.5,0.99,0.30).未来我们将继续就简化非极大值抑制阈值设置和小尺寸目标的漏检问题进行研究.

作者:张强 张陈斌 陈宗海 单位:中国科学技术大学自动化系

简化非极大值抑制分析

转载请注明出处学文网 » 简化非极大值抑制分析

学习

“阿房宫”的读音

阅读(35)

本文为您介绍“阿房宫”的读音,内容包括阿房宫人教版正确读音,阿房宫正确读音。唐・杜牧《阿房宫赋》是古今脍炙人口的名篇,说道:“六王毕,四海一,蜀山兀,阿房出……”其中“阿房”二字,一般读ēpán,但也有不少人读ēfán溃之外还有读āfán

学习

合成往往谬误

阅读(19)

本文为您介绍合成往往谬误,内容包括合成谬误和分解谬误,合成谬误怎么读。经济学里有一个概念,叫合成谬误,最早由美国著名经济学家萨缪尔森提出来。他说:“由于某一原因对个体来说是正确的,便据此认为对整体来说也是对的,这就是合成推理的谬误

学习

如何理解函数的概念

阅读(54)

本文为您介绍如何理解函数的概念,内容包括初中函数的概念入门教学,指数函数的概念引入。摘要:函数概念是数学中的一个极其重要的基本概念,它贯穿于整个中学数学学习,是中学数学中的核心概念,也是近现代数学的基石.然而函数概念的学习又是一

学习

大数据时代指挥信息系统发展研究

阅读(52)

本文为您介绍大数据时代指挥信息系统发展研究,内容包括武警警官学院大数据工程指挥专业,莆田市大数据调度指挥平台。摘要:大数据时代的到来,让各行各业都有了很大的改变,它也逐渐在多方面被运用。在一些发达国家,指挥信息系统里添加了大数据

学习

一滴水经过丽江

阅读(30)

本文为您介绍一滴水经过丽江,内容包括一滴水经过丽江全文资料,一滴水经过丽江全文概括。有一天,我醒来,发现自己变成了坚硬的冰。和更多的冰挤在一起,缓缓向下流动。在许多年的沉睡里,我变成了玉龙雪山冰川的一部分。我望见了山下绿色的盆地

学习

中国人地关系问题简论

阅读(85)

本文为您介绍中国人地关系问题简论,内容包括中国人地关系的主要特点,人地关系的历史问题。[摘要]人地关系是贯穿整个人类社会发展的主线,涉及到社会发展的方方面面。从历史长时段观察,人地关系演变的总体趋势越来越紧张。古代为解决人稠

学习

涡轮螺旋桨发动机简史

阅读(21)

本文为您介绍涡轮螺旋桨发动机简史,内容包括pw150c涡轮螺旋桨发动机,tp400-d6涡轮螺旋桨发动机。起源

学习

热科学与技术

阅读(23)

本文为您介绍热科学与技术,内容包括热科学与技术期刊,热机技术期刊简介。1.非对称树状二分岔结构的有效导热系数万宾,乐恺,郑连存,张欣欣,WANBin,YUEKai,ZHENGLian-cun,ZHANGXin-xin

学习

寻找香格里拉

阅读(23)

本文为您介绍寻找香格里拉,内容包括寻找香格里拉全集,寻找香格里拉。对于有的藏民而言,这种磕等身长头的徒步朝圣之旅大概需要几个月,而对偏远地区的藏民来说则要花上好几年才能完成。在大昭寺前面的广场上,沿着环绕大昭寺的转经路上,磕等身

学习

建筑物鞭梢效应分析

阅读(25)

本文为您介绍建筑物鞭梢效应分析,内容包括建筑物鞭梢效应,鞭梢效应在水里存在吗。[摘要]本文首先对鞭梢效应做了介绍,并例举了其本质,分析了鞭梢效应和悬臂结构的区别,然后利用PKPM建模对建筑物进行受力计算分析,最后得出减小鞭梢效应的相应

学习

英语中“许多”的表达法

阅读(21)

本文为您介绍英语中“许多”的表达法,内容包括英语中许多的多种表达,英语中序号的表达。英语中“许多”的表达法有许多,如many,agreat/goodmany,quiteafew,a(large)numberof,largenumbersof,most,manya,morethanone,much,quitealittle,agreatdealof,al

学习

“战争之王”原型维克托.布特:贩卖死亡的商人

阅读(20)

本文为您介绍“战争之王”原型维克托.布特:贩卖死亡的商人,内容包括维克托·布特对俄罗斯有什么意义,维克托·布特对战争之王的看法。在获悉维克托将在3个月内被引渡至美国后,俄罗斯外长谢尔盖・拉夫罗夫称泰国的判决受到了“可悲的外部

学习

咏叹调《偷洒一滴泪》音乐学诠释

阅读(19)

本文为您介绍咏叹调《偷洒一滴泪》音乐学诠释,内容包括经典咏叹调唱段偷洒一滴泪,偷洒一滴泪中的咏叹调怎么唱。《偷洒一滴泪》是意大利歌剧家唐尼采蒂《爱的甘醇》男主角内莫里尼在第二幕时演唱的著名抒情男高音咏叹调,此首作品中体现

学习

乘物以游心

阅读(23)

本文为您介绍乘物以游心,内容包括乘万物以游心原文,乘物游心啥意思。关键词:莫兰迪;形而上;乘物以游心;真实