点云x变形金刚!

Transformer 13/01/2021

三个要点：
✔️ 我们提出了一种新的基于变压器的方法来理解3D点云。
✔️ 设计一个新的基于变压器的架构
✔️ 获得多个三维点云数据集的SOTA。

Point Transformer
written by Hengshuang Zhao, Li Jiang, Jiaya Jia, Philip Torr, Vladlen Koltun
(Submitted on 16 Dec 2020)
Comments: Accepted to arXiv.
Subjects: Computer Vision and Pattern Recognition (cs.CV)

comm

首先

Transformer已经接管了自然语言处理，并迅速推进技术的发展。最近，利用这些自注意力网络的力量来解决计算机视觉问题的尝试是富有成效的。因此，尝试实现变形金刚进行三维点云处理是很直观的。此外，由于三维点云是嵌入在三维空间中的集合，因此自注意力网络对集合的换元和集合的cardinality是不变的，这对三维点云的处理更加有利。基于这些直觉，本文介绍了一种新的用于3D点云处理的Transformer基础。该层扩展为一个点变换器网络，可以在不同的域和任务中设置数据集的新状态。