橙子橙子  2022-01-13 09:59 知行编程网 隐藏边栏 |   抢沙发  28 
文章评分 1 次,平均分 5.0

在开放集的世界里如何进行目标检测呢?下面橙子姐姐带大家一起看看一项新的工作!

利用开放世界方案扩展一阶段检测在许多应用中,例如自动驾驶、手动操作或机器人导航,物体检测方法必须能够检测到训练集中看不见的物体。开放世界检测 (OWD) 试图通过将检测性能推广到可见和不可见的类别来解决这个问题。最近的工作已经在生成与类别无关的建议方面取得了成功,本文称之为开放世界建议(OWP),但是当在检测模型中考虑这两个任务时,这是以分类任务的大幅下降为代价的。这些作品利用客观性评分线索研究了两阶段区域建议网络(RPN);然而,由于其简单性、运行时间以及定位和分类的解耦,本文通过全卷积一级检测网络的镜头研究 OWP,例如 FCOS [35]。本文表明,本文在 FCOS 上的架构和采样优化可以将 OWP 性能提高多达 6%,在新类的召回中,标志着第一个无提案的单阶段检测网络可以实现与基于 RPN 的两阶段网络相当的性能.

利用开放世界方案扩展一阶段检测

此外,本文表明 FCOS 固有的解耦架构有利于保持分类性能。虽然两阶段方法在新类上的召回率下降了 6%,但本文表明,当联合优化 OWP 和分类时,FCOS 仅下降 2%。目标检测包括两个任务:定位和检测。许多先前的工作已经在两个阶段执行此操作定位阶段找到潜在对象的边界框,然后将其馈送到分类阶段,该阶段将每个对象分类在有限的范围内组的类别。例如,在 Faster R-CNN [34] 中,分类阶段以区域提议网络 (RPN) 生成的框为条件,并在多个数据集上取得了巨大成功;然而,尽管它们取得了成功,但这些网络在检测具有大尺寸可变性的对象方面显示出局限性,并且需要对跨数据集泛化进行详尽的调整 [4, 39, 46]。此外,通过定位分类阶段,定位阶段生成的建议倾向于过度拟合训练类类别,因此它们往往对训练集中不可用的对象不准确 [11, 14]。本文寻求通过解决开放世界检测 (OWD) 来解决这个问题,并特别考虑其与类别无关的提案生成子问题 [22, 36, 38],本文将其称为开放世界提案 (OWP) )。生成 OWP 将产生更有效的定位网络,可应用于诸如在自动驾驶期间检测未知物体 [15]、自动威胁检测 [23]、长尾词汇检测 [16] 或与类别无关的语义分割等任务[43]。本文还认为 OWP 是一个很有前途的元学习问题,因为提案生成适用于任何特定的对象检测数据集。对象检测数据集仅提供前景中某些对象的真实框,本文试图在这些注释上进行训练,以学习可以很好地推广到看不见的类别的对象的基本特征。先前的工作已经研究了诸如中心性、联合交集 (IOU) [20, 25, 35] 等对象线索的功效,以掩盖不“接近”地面实况注释的 logit 预测。对象定位网络 (OLN) [22] 表明,将这些线索与 RPN 相结合使其能够生成与类别无关的建议。在训练与类无关的检测器时,本文将训练类类别分为两组:用于训练的基类和在评估期间用于测试对新对象类型的泛化性的新的未见类。在 OLN 之后,本文寻求在未见类类别集上最大化 OWP 性能。然而,与 OLN 相比,本文还寻求在所见类类别集上保持分类性能,本文称之为 OWP 感知分类。这一点尤其重要,因为虽然生成 OWP 对于许多应用程序很重要,但仍然能够对相关类别的子类进行分类通常很关键 [14]。本文对 OWP 上的 FCOS 架构进行了彻底的调查,并OWP 感知分类。与 OLN [22] 类似,本文研究了 FCOS 在 COCO 数据集上的基线性能,发现其默认的中心机制对 OWP 不是很有效。因此,本文研究使用 IOU 作为客观性度量,并使用 IOU 采样机制来强制执行硬否定,这些优化将 OWP 提高了 6%。此外,本文重新添加了分类任务,发现由于分类和回归头的解耦,FCOS 可以保留 OWP 性能,同时仍然保持分类准确性,优于 OLN。本文还提出了 Unknown Object Masking 来移除“未知对象”,即证明了 OWP 和分类的性能。 为了鲁棒性,本文将所有优化都带到了 LVIS 数据集,除了未知对象掩蔽之外,本文可以看到每个优化的性能增强。 进一步的研究将包括通过使用非最大抑制区域而不是单个点来改进未知对象掩蔽过程。 总之,本文表明 FCOS 在实现 OWP 的同时成功地保留了分类性能,这是第一个这样做的单阶段网络。

文章网址:https://arxiv.org/pdf/2201.02302v1.pdf

本文来自投稿,不代表知行编程网立场,版权归原作者所有,欢迎分享本文,转载请保留出处!

橙子
橙子 关注:2    粉丝:2
美丽又迷人的橙子姐姐~

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享