cornernet论文阅读笔记

news/2024/7/4 13:12:50

CornerNet: Detecting Objects as Paired Keypoints

  • 这里的corner是角的意思而不是中心,也就是说,该网络为一阶段目标检测网络,预测的是目标的左上角和右下角两个“corner”而构成一个bbox

  • 本模型是无需anchor box的方法,模型的输出是左上角的一个heatmap和右下角的一个heatmap和一个embedding vector来配对每对corner,每对配对的corner在第三个输出的相应位置上具有相同的embedding vector

  • 网络结构如图:

  • 在这里插入图片描述

  • 提出了适合cornernet的maxpooling(corner pooling),pooling的输入是两个featuremap,输出是两个pooling的和;理论依据是corner并非local的,而左上角的corner需要往右和往下看,右下角的也类似。
    在这里插入图片描述

  • 作者认为,预测corner只需要看2个方向而预测中心需要看4个方向,因此预测corner更简单;而且,用corner来表示一张w*h的图里的bbox,复杂度是O(wh)(左上角有wh种情况,右下角有wh种情况,是加和,因为该模型的一个左下角只对应一个右下角),用anchor来表示需要 O ( w 2 h 2 ) O(w^2h^2) O(w2h2)(位置有wh种情况,大小有wh种情况,是乘积,因为一个位置同时对应多种大小)

  • 没有多尺度预测,然后对于corner的预测也有位置上的offset;backbone用的是hourglass network;对于左上角的heatmap有C个通道,C是类别数,没有设置背景类

  • 在这里插入图片描述

  • 对于每个目标,只有一个positive的左上角,因此其他的左上角都是negative的,但是当某个negative的左上角与positive的左上角的距离在某个范围内时,降低loss,这个范围是根据该左上角画出的bbox与gtbox的iou要大于某个值来决定的,reduction的程度根据距离不同而不同,为以positive corner为中心的2D 高斯分布

  • 损失函数如下:

  • 在这里插入图片描述

  • offset的预测被认为是用来解决网络downsampling中造成的误差,我觉得这个解释可以。

  • embedding的想法并非本文先提出的,反正采取的是两个loss来使得相关的corner的embedding更接近而不相关的更远:

  • 在这里插入图片描述

  • 具体embedding和hourglass net见这三篇文章:

  • Newell, A. and Deng, J. (2017). Pixels to graphs by associative embedding. In Advances in Neural Information Processing Systems, pages 2168-2177.

  • Newell, A., Huang, Z., and Deng, J. (2017). Associative embedding: End-to-end learning for joint detection and grouping. In Advances in Neural Information Processing Systems, pages 2274-2284.

  • Newell, A., Yang, K., and Deng, J. (2016). Stacked hourglass networks for human pose estimation. In European Conference on Computer Vision, pages 483-499. Springer

  • 在这里插入图片描述


http://www.niftyadmin.cn/n/3658001.html

相关文章

分析:“新一代Windows文件系统”WinFS 夭折的几大因素

本文 2006.6.27最后更新曾经被人们寄予希望微软新一代文件系统WinFS,终于在近日宣布终止研发项目。不会再将WinFS 作为一个独立的组建来发布,这一决定也意味着 Vista 将会继续采用单纯的NTFS 文件系统。按照目前的情形分析,Vista 将会是微软桌…

CenterNet 论文阅读笔记

CenterNet: Keypoint Triplets for Object Detection 是在cornernet上做改进提出的,认为cornernet对bbox内部信息缺少关注,因此在cornernet两个corner分支的基础上增加center分支,关注bbox内部信息

TIOBE 2006年7月最流行开发语言排名 VB.Net再度下滑

TIOBE 语言排名一个月更新一次。它的统计方法是基于全球有经验的工程师,科目和第三方厂商. 同时也参考来自google,msn,yahoo等搜索引擎计算得出的结果。当然,这个排名并不说明哪个语言绝对最好,但是它可以给你一个参考,当你构建一…

Regularizing Class-wise Predictions via Self-knowledge Distillation 论文阅读笔记

Regularizing Class-wise Predictions via Self-knowledge Distillation 理解了什么是知识蒸馏就能理解这篇文章的意义。知识蒸馏一般用于教师-学生网络,也就是说,在分类任务下,有一个训练得很完善的网络,对某一个样本输出logit值…

微软收购Zend假新闻看开源需要新心态

近日,看到CSDN一条IT传闻,“微软1.13亿美元收购zend,PHP可能改名MSSE ”。当然,这是来自国外PHP社区的愚人节新闻,也许无法知道这条新闻的作者是否来自于开源,但是从新闻后面的评论中,还是看出了目前开源社…

Vista MMC和PowerShell未达目标并更名"Aspen"

微软管理控制台(MMC)是针对管理应用程序的扩展通用显示服务。PowerShell代号Monad是微软下一代Windows命令行外壳工具和脚本语言工具支持Windows XP/2003/Vista系统,需要.NET Framework 2.0。该工具有助于管理员实现对Windows桌面和服务器任务…

2020年6月-2021年4月以来的总结

- 之所以到现在才总结,实在是之前觉得,自己似乎从大二暑假开始,停下了步伐,科研也没什么进展,也没什么成功,好像已经过了激流勇进的时间,开始放慢了。我承认,一方面可能我真的有所松…