【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた！

Data Augmentation 2020年05月17日

3つの要点
✔️ 画像分類タスクに必要不可欠なData Augmentationの体系をまとめた
✔️ 基本的なData Augmentationについて手法と利点/欠点をまとめた
✔️ 基本的なDAは実装が簡単な上に絶大な効果を発揮する

A survey on Image Data Augmentation for Deep Learning
written by Connor Shorten, Taghi M. Khoshgoftaar
(Submitted on 06 July 2019)
Comments: Published by Journal of Big Data
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Image and Video Processing (eess.IV)

導入

CNNは今や画像認識分野において欠かせない存在になっています。SoTAモデル(NoisyStudentやSimCLRなど。)はいずれもCNNを使っており、これからもしばらく使われ続けていくでしょう。ただし、CNNにも欠点があります。それは「学習に大量のデータを要する」ということです。例えば医療分野などでは必ずしも大量のデータが手に入るとは限りません。それなら今ある画像データから新たな画像データを人工的に作ってしまえばいいのです。それを実現する技術こそが、Data Augmentation(データオーギュメンテーション、以下DA)なのです。この記事ではDAの種類およびまずは基本的なDAを例を用いながら紹介していきます。(本記事を書くにあたって、DAにはtorchvisionとalbumentationsを使用いたしました。)