【GAN】NVIDIAが極端に少ないデータセットでも高精度なGANを達成! 過学習しないAugmentation ADAとは!?
3つの要点
✔️ NVIDIA研究チームが極端に少ないデータセットでも高精度なGANを実現
✔️ 新しいAugmentation手法ADAにより過学習を防ぐ
✔️ 確率の考えを導入してAugmentationしても精度を下げない
Training Generative Adversarial Networks with Limited Data
written by Tero Karras, Miika Aittala, Janne Hellsten, Samuli Laine, Jaakko Lehtinen, Timo Aila
comm
(Submitted on 11 Jun 2020 (v1), last revised 7 Oct 2020 (this version, v2))
Comments: Project website: this https URL
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Neural and Evolutionary Computing (cs.NE); Machine Learning (stat.ML)
official
1. はじめに
近年のGANの目覚ましい発展は,オンライン上の膨大な画像データを使用することで実現されていますが,こうした大量の画像を特定の物や場所,時間などの制約下で収集することは非常に困難でした.一方で,少量のデータセットだけではDiscriminatorが過学習する恐れがあります.過学習対策としては,ほとんどのディープラーニング領域では,角度を変えたりノイズを加えたりするData Augmentation(データの水増し)を行います.しかし,GANでData Augmentationを行うと,同様に水増しされたデータセットを用いているにも関わらず,全く望ましくない画像を生成することになってしまいます.例えば,ノイズを加えたデータセットを使用することで,GANによって生成された画像にもノイズが加わってしまうのです.
この論文では,Data AugmentationによってDiscriminatorが過学習することを防ぎつつ,その加えたノイズが生成画像に反映されないようにすることを実現しています.まず,Data Augmentationによって生成画像にノイズが加わらないようにする条件を包括的に分析し,さらにデータセットの条件に左右されないで同じ手法を実現できるように多様なData Augmentation方法をデザインしています.また,数千という少量のデータからStyleGAN2によって良い結果を出せていることを示し,限られた数のデータのせいで結果が伸び悩んでいたCIFAR-10ベンチマークでも良い結果を出すことが可能であることを示します.さらに,METFACESという限られたデータセットという条件下における新たなベンチマーク用のデータセットも提供しています.
続きを読むには
(6347文字画像20枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー