【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成技術により、誰でも簡単にネイティブ並みの発音を! 【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成 ... 2025年02月04日 Speech Recognition for the Dysarthric
【AudioLDM】Latent Diffusionを用いたText-to-Audioの生成モデル 【AudioLDM】Latent Diffusionを用いたText- ... 2024年01月16日 Diffusion Model
【Versatile Diffusion】テキストと画像を統合的に扱う拡散モデル 【Versatile Diffusion】テキストと画像を統合的に扱う ... 2023年12月21日 Diffusion Model
画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能に! 画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能 ... 2022年10月28日 Image Caption
深層生成モデルの学習に大きな計算機はもう必要ない!?バイナリー深層生成モデル 深層生成モデルの学習に大きな計算機はもう必要ない!?バイナリー深層生成 ... 2021年10月27日 Binary Neural Network
【Infinite Nature】1枚の画像からイメージビデオを自動生成!? Googleのとんでもない研究とは!? 【Infinite Nature】1枚の画像からイメージビデオを自動生 ... 2021年02月09日 GAN(敵対的生成ネットワーク)
完全教師無しで物体検出と背景のセグメンテーションを行うVAEベースの最新手法 "SPACE" 完全教師無しで物体検出と背景のセグメンテーションを行うVAEベースの最 ... 2020年09月09日 VAE