你需要知道的关于计算机视觉中变压器的一切!Part2/5(图像识别和物体检测)
3个要点
✔️本次演讲将讨论Transformer在计算机视觉中的应用。
✔️本文讨论了图像识别和物体检测任务中的实际案例。
✔️本文介绍了总共37个型号中的9个型号。
Transformers in Vision: A Survey
written by Salman Khan, Muzammal Naseer, Munawar Hayat, Syed Waqas Zamir, Fahad Shahbaz Khan, Mubarak Shah
(Submitted on 4 Jan 2021)
Comments: 24 pages
Subjects: Computer Vision and Pattern Recognition (cs.CV)![]()
首先
Transformer不仅在自然语言处理方面表现出了很高的性能,在其他很多领域也表现出了很高的性能。其中,变压器在处理视觉信息的计算机视觉领域的应用研究已经非常普及。鉴于这种需求,本文对计算机视觉中的Transformer进行了非常广泛和详细的描述。 在本文中,我们将介绍变压器在图像识别和物体检测任务中的一些应用。
介绍了7种图像识别模型和2种物体检测模型。
关于其他任务的研究实例,请参见第3、4、5部分,关于计算机视觉中变压器的一般描述,请参见第1部分。
总体结构(目录)
1.关于计算机视觉中的变压器(Part1)
2. 变压器在计算机视觉中的具体例子
2.1图像识别的变压器
・CCNet(交叉注意)
・ 独立的自我关注
・ 本地关系网
・注意力增强卷积网络
・ 矢量化自我关注
・ViT(Vision Transformer)
・DeiT(数据高效图像转换器)
2.2 物体检测用变压器
・DETR(检测变压器)
・D-DETR(可变形DETR)
2.3细分市场的变压器
2.4 图像生成的变压器
2.5 低级视觉的变压器(第三部分)
2.6 多模态任务的变压器(第三部分)
2.7 视频理解(Part4)
2.8 低射学习中的变压器(Part4)
2.9 集群用变压器(第四部分)
2.10 3D分析用变压器(Part4)
3. 变压器在计算机视觉中的问题及未来展望(Part1)
要阅读更多。
你需要在AI-SCHOLAR注册。
或与本文相关的类别