提出TOODIB方法通过交互分支模块、改进的交互卷积层和任务相关空间解耦模块解决一阶段目标检测中的任务对齐问题,在MS-COCO2017上实现AP提升至47.6,空间偏移减少至3.41像素。 在机器视觉领域,目标检测是一项重要的任务,其核心目标是识别图像或视频中的物体 ...
管状结构(例如血管、道路)是临床、自然界等各领域场景中十分重要的一种结构,其的精确分割可以保证下游任务的准确性与效率。然而这并不是一个简单的任务,主要的挑战源于细长微弱的局部结构特征与复杂多变的全局形态特征。 本文关注到管状结构细长 ...
近两年来,有关Transformer的文章可谓是井喷式爆发,许多研究员都在设计各种任务上的Transformer模型。然而,Attention作为Transformer的核心模块,真的比卷积强吗?今天的这篇文章或许能带给你新视角,微软亚洲研究院的研究员们从Local Attention和Dynamic Depth-wise ...
这篇工作主要是由我和SENet的作者胡杰一起完成的,也非常感谢HKUST的两位导师 陈启峰和张潼老师的讨论和建议。 本文是对我们CVPR 2021被接收的文章 Involution: Inverting the Inherence of Convolution for Visual Recognition的介绍,同时也分享一些我们对网络结构设计(CNN和 ...