【WavLM】すべての音声認識モデルを過去にする!?構造や性能はどうなっているのか? 【WavLM】すべての音声認識モデルを過去にする!?構造や性能はどうな ... 2024年09月30日 Speech Processing
【構音障害者でも音声起動システムを使いたいっ!】音声起動システムのためのコーパスと音声起動システムとは? 【構音障害者でも音声起動システムを使いたいっ!】音声起動システムのため ... 2024年09月28日 Sound
【構音障害の重症度分類を自動化!?】wav2vec2をも上回るSALRの導入実験 【構音障害の重症度分類を自動化!?】wav2vec2をも上回るSALR ... 2024年09月22日 Speech Recognition for the Dysarthric
【Google × Meta】XLS-R大規模モデルで音声認識と音声翻訳をこなす 【Google × Meta】XLS-R大規模モデルで音声認識と音声翻 ... 2024年09月21日 Speech Recognition for the Dysarthric
【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音障害者音声認識でも輝くのか! 【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音 ... 2024年08月31日 Speech Recognition for the Dysarthric
【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線を画す"HuBERT"モデルの性能はいかに 【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線 ... 2024年08月29日 AI for Science
【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識を行なう革新的な技術!? 【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識 ... 2024年08月07日 Speech Recognition for the Dysarthric
【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規化 【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規 ... 2024年07月26日 self-supervised learning