MLPの代わりにKolmogorov-Arnold Network(KAN)を導入してモデルの表現力と性能を向上 MLPの代わりにKolmogorov-Arnold Network(K ... 2024年09月24日 Large language models
【Google × Meta】XLS-R大規模モデルで音声認識と音声翻訳をこなす 【Google × Meta】XLS-R大規模モデルで音声認識と音声翻 ... 2024年09月21日 Speech Recognition for the Dysarthric
【RetrievalAttention】長い文脈を処理するLLMの効率を向上! 【RetrievalAttention】長い文脈を処理するLLMの効率 ... 2024年09月19日 Large language models
インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの開発 インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの ... 2024年09月09日 Large language models
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 2024年08月27日 Large language models
GenTron: 画像生成、動画生成向けのDiffusion Transformers GenTron: 画像生成、動画生成向けのDiffusion Tran ... 2024年08月26日 Image generation
【コマ撮り画像の高FPS動画化】フレーム補間AI技術RIFE&IFNetの仕組みと活用術 【コマ撮り画像の高FPS動画化】フレーム補間AI技術RIFE&IFNe ... 2024年08月20日 Image generation
【Double Descent】なぜ「大きなモデル」と「大きなデータセット」が重要なのか 【Double Descent】なぜ「大きなモデル」と「大きなデータセ ... 2024年07月25日 Neural Network
【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベースのボコーダー 【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベー ... 2024年07月10日 Speech Synthesis
【Mustango】音楽のドメイン知識を活用した音楽生成モデル 【Mustango】音楽のドメイン知識を活用した音楽生成モデル 2024年07月01日 Audio and Speech Processing
【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデル 【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデ ... 2024年07月01日 Speech Synthesis