【AudioLDM】Latent Diffusionを用いたText-to-Audioの生成モデル 【AudioLDM】Latent Diffusionを用いたText- ... 2024年01月16日 Diffusion Model
【CoDi】ほぼ全てのモダリティを扱えるAny-to-Anyの拡散モデル 【CoDi】ほぼ全てのモダリティを扱えるAny-to-Anyの拡散モデ ... 2024年01月12日 Diffusion Model
【Versatile Diffusion】テキストと画像を統合的に扱う拡散モデル 【Versatile Diffusion】テキストと画像を統合的に扱う ... 2023年12月21日 Diffusion Model
【LP-MusicCaps】LLMを用いた音楽キャプションの自動生成 【LP-MusicCaps】LLMを用いた音楽キャプションの自動生成 2023年11月20日 Contrastive Learning
【MuLan】対照学習を利用したMusic-Textのマルチモーダル 【MuLan】対照学習を利用したMusic-Textのマルチモーダル 2023年10月24日 Contrastive Learning
【MusicLM】Googleが開発したText-to-Musicの生成モデル 【MusicLM】Googleが開発したText-to-Musicの生 ... 2023年10月18日 Transformer
GANをスマホで動かす!圧縮手法の組み合わせで軽量化、「GAN Slimming」 GANをスマホで動かす!圧縮手法の組み合わせで軽量化、「GAN Sli ... 2020年09月18日 GAN(敵対的生成ネットワーク)