【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた!

【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた!

3つの要点
✔️ 画像分類タスクに必要不可欠なData Augmentationの体系をまとめた
✔️ 基本的なData Augmentationについて手法と利点/欠点をまとめた  

✔️ 基本的なDAは実装が簡単な上に絶大な効果を発揮する

A survey on Image Data Augmentation for Deep Learning
written by Connor Shorten, Taghi M. Khoshgoftaar
(Submitted on  06 July 2019)

Comments: Published by Journal of Big Data
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Image and Video Processing (eess.IV)

導入

CNNは今や画像認識分野において欠かせない存在になっています。SoTAモデル(NoisyStudentSimCLRなど。)はいずれもCNNを使っており、これからもしばらく使われ続けていくでしょう。ただし、CNNにも欠点があります。それは「学習に大量のデータを要する」ということです。例えば医療分野などでは必ずしも大量のデータが手に入るとは限りません。それなら今ある画像データから新たな画像データを人工的に作ってしまえばいいのです。それを実現する技術こそが、Data Augmentation(データオーギュメンテーション、以下DA)なのです。この記事ではDAの種類およびまずは基本的なDAを例を用いながら紹介していきます。(本記事を書くにあたって、DAにはtorchvisionalbumentationsを使用いたしました。)

imageda_fig4

本記事では以下の流れで解説していきます。

  1. Data Augmentationの種類
  2. 基本的なData Augmentationまとめ
  3. 結論

@omiita_atiimoでツイッターもやっています。人工知能に関することや新しく書いた記事などについてつぶやいています。人工知能についてもっと知りたいという方はぜひフォローしてください。

この記事をシェアする