赶上最新的AI论文

你需要知道的关于计算机视觉中变压器的一切!第4/5部分(多式联运任务)

你需要知道的关于计算机视觉中变压器的一切!第4/5部分(多式联运任务)

Transformer

3个要点
✔️解释Transformer在计算机视觉中的应用。

✔️讲解分割、图像生成和低级视觉任务的研究实例。
✔️共37款,本文介绍了9款。

Transformers in Vision: A Survey
written by Salman Khan, Muzammal Naseer, Munawar Hayat, Syed Waqas Zamir, Fahad Shahbaz Khan, Mubarak Shah
(Submitted on 4 Jan 2021)
Comments: 24 pages
Subjects: Computer Vision and Pattern Recognition (cs.CV)
 

首先

Transformer不仅在自然语言处理方面表现出了很高的性能,在其他很多领域也表现出了很高的性能。其中,变压器在处理视觉信息的计算机视觉领域的应用研究已经非常普及。

鉴于这种需求,我们将对计算机视觉中的Transformer进行非常广泛和详细的描述。

本文将介绍Transformer在多模态任务中的应用。

共介绍了9种多模态任务的模型。

关于其他任务的研究实例,请参见第2、3、5部分,关于计算机视觉中变压器的一般描述,请参见第1部分。

总体结构(目录)

1. about Transformer in Computer Vision (explained in Part1)

2. A Concrete Example of Transformer in Computer Vision(Part2~5)
  2.1 Transformers for Image Recognition(Part2)
  2.2 Transformers for Object Detection(Part2)
  2.3 Transformers for Segmentation(Part3)
  2.4 Transformers for Image Generation(Part3)
  2.5 Transformers for Low-level Vision(Part3)
  2.6 Transformers for Multi-modal Tasks
    ・ViLBERT(Vision and Language BERT)
    ・LXMERT
    ・VisualBERT
    ・VL-BERT
    ・Unicoder-VL(Universal Encoder for Vision and Language)
    ・UNITER
    ・OSCAR(Object-Semantics Aligned Pre-training)(
    ・Vokenization
    ・Vision-and-Language Navigation
  2.7 Video Understanding(Part5)
  2.8 Transformers in Low-shot Learning(Part5)
  2.9 Transformers for Clustering(Part5)
  2.10 Transformers for 3D Analysis(Part5)

3. Issues and future prospects of Transformer in computer vision (explained in Part1)

要阅读更多。

你需要在AI-SCHOLAR注册。

1分钟内免费轻松注册

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!

如果您对文章内容有任何改进建议等,请通过 "联系我们 "表格与爱学网编辑部联系。
如果您能通过咨询表与我们联系,我们将非常感激。

联系我们