最新AI論文をキャッチアップ

AI-SCHOLARとは？

BigGANを超えた！DeepMind、史上最強の非GANジェネレータVQ-VAE-2を提案

論文 2019年06月06日

3つの要点
✔️ BigGANを超えた最強の非GANジェネレータの登場
✔️ 階層型の潜在マップを使用し、潜在表現を異なるスケール毎に学習
✔️ 階層内の各レベルを個別にピクセルに依存させることで、デコーダでの再構成エラーを減らす

Generating Diverse High-Fidelity Images with VQ-VAE-2
written by Ali Razavi, Aaron van den Oord, Oriol Vinyals
(Submitted on 2 Jun 2019)
Comments: Published by arXiv
Subjects: Machine Learning (cs.LG); Computer Vision and Pattern Recognition (cs.CV); Machine Learning (stat.ML)

はじめに

BigGAN は「歴史上最強のGANジェネレータ」として知られています。

最大512×512ピクセルの高解像度画像を条件付きで生成するモデルで、なんと1000カテゴリーの画像を生成出来ます。従来のスコアを大幅に更新し話題になりました。

現在GANは画像生成において向かう所敵なしといった感じですが、本当にGANは画像を生成するための最良の方法なのでしょうか？

DeepMindが最近発表した論文では、VQ-VAEを使用した画像生成に取り組んでいます。現在の最良のGANモデル（BigGAN-deep）に匹敵する画像を生成することに成功しました。さらに画像の多様性がBigGAN-deepより優れていることが分かりました。

続きを読むには

(2469文字画像11枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または

この記事に関するカテゴリー

wevnal-ai-scholar

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする