你需要知道的关于计算机视觉中的变形金刚的一切!第1/5部分(摘要、问题和展望)
三个要点
✔️解释Transformer在计算机视觉中的应用。
✔️介绍与各种任务相关的模型和方法。
✔️从视觉上解释Transformer的挑战和未来前景。
Transformers in Vision: A Survey
written by Salman Khan, Muzammal Naseer, Munawar Hayat, Syed Waqas Zamir, Fahad Shahbaz Khan, Mubarak Shah
(Submitted on 4 Jan 2021)
Comments: 24 pages
Subjects: Computer Vision and Pattern Recognition (cs.CV)![]()
介绍
Transformer不仅在自然语言处理方面表现出了很高的性能,在其他很多领域也表现出了很高的性能。其中,变压器在处理视觉信息的计算机视觉领域的应用研究已经非常普及。
根据这一需求,我们将对变形金刚在计算机视觉领域的现状和未来前景进行全面的阐述。
本文对计算机视觉中的变压器进行了总体描述,包括过去提出的方法的总体分类、目前存在的问题以及未来的展望。
在第2~5部分,我们将对过去提出的计算机视觉中与Transformer相关的每一种方法进行单独的具体说明。
需要解释的变形金刚型号总数高达。37件一共
最新出台的办法是在2020年12月发布的,涵盖了最近的研究。希望对Transformer在图像、视频处理等方面的应用感兴趣的朋友,以及想详细掌握具体模型知识的朋友有所帮助。
总体结构(目录)
1、关于计算机视觉中的变压器
・各种方法的广泛分类
2.Transformer在计算机视觉中的具体应用实例(详见Part2-5的解释)
・图像识别中的变形金刚(第二部分)
・物体检测的变压器(第二部分)
・细分的变压器(第三部分)
・图像生成的变形金刚(第三部分
・低级视觉的变压器(第三部分)
・多模态任务的变压器(第四部分)
・视频理解(第五部分)
・变形金刚在低分段学习中的应用(第五部分)
・聚类的变压器(第五部分)
・3D分析用的变压器(第五部分)
3.变压器在计算机视觉中的挑战和未来展望
・高计算成本
・高数据成本
・需要新颖的设计
・变形金刚的可解释性
・硬件高效设计
・自我监督是答案吗?
要阅读更多。
你需要在AI-SCHOLAR注册。
或与本文相关的类别