最新AI論文をキャッチアップ

AI-SCHOLARとは？

MATE：マルチエージェントによるアクセシビリティ特化モダリティ変換フレームワーク

MATE：マルチエージェントによるアクセシビリティ特化モダリティ変換フ ...

2025年08月12日 LLM-Paper

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システムの挑戦

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システ ...

2025年07月03日 LLM-Paper

【誰もが便利さを享受するために...】whisperを利用した構音障害者音声の話者適応

【誰もが便利さを享受するために...】whisperを利用した構音障害 ...

2025年02月18日 Speech Recognition for the Dysarthric

【常識を覆す音声処理モデル！？】Microsoft社が開発する音声処理モデル”SpeechT5”の驚くべき性能とは

【常識を覆す音声処理モデル！？】Microsoft社が開発する音声処理 ...

2025年02月17日 Sound

【こんなところにwav2vec2を使うのっ！？】構音障害音声の特徴量抽出がより効率的になるんです

【こんなところにwav2vec2を使うのっ！？】構音障害音声の特徴量抽 ...

2025年02月14日 Speech Recognition for the Dysarthric

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音 ...

2025年02月14日 Speech Recognition for the Dysarthric

【いままでの常識を覆す論文！？】構音障害者の特性じゃなく、ノイズで分類わけされていた！

【いままでの常識を覆す論文！？】構音障害者の特性じゃなく、ノイズで分類 ...

2025年02月13日 Speech Recognition for the Dysarthric

【便利さの享受は平等であれ！】構音障害者音声コーパス”EasyCallコーパス”

【便利さの享受は平等であれ！】構音障害者音声コーパス”EasyCall ...

2025年02月10日 Speech Recognition for the Dysarthric

【”あたりまえ”を疑え！】超低複雑性DNNを用いたノイズ抑圧

【”あたりまえ”を疑え！】超低複雑性DNNを用いたノイズ抑圧

2025年02月07日 NOISE SUPPRESSION

【誰でも英語が話せる時代到来！？】多言語に対応したゼロショット音声合成技術により、誰でも簡単にネイティブ並みの発音を！

【誰でも英語が話せる時代到来！？】多言語に対応したゼロショット音声合成 ...

2025年02月04日 Speech Recognition for the Dysarthric

CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得

CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得

2025年01月30日 natural language processing

【愛犬も話したZero-shot Learning】AI音声クローンとリップシンキングの検証と解説

【愛犬も話したZero-shot Learning】AI音声クローンと ...

2025年01月29日 Neural Network

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ...

2025年01月24日 Large language models

構音障害者も高齢者も見捨てない、A2A変換器による音声認識率改善

構音障害者も高齢者も見捨てない、A2A変換器による音声認識率改善

2024年12月25日 Speech Recognition for the Dysarthric

革新的な音声感情認識：WavLM Largeを活用した性別情報統合と高度プーリング手法の探求

革新的な音声感情認識：WavLM Largeを活用した性別情報統合と高 ...

2024年10月18日 Large language models

大規模言語モデルを活用して、自然な表情と会話の実現する「Furhatロボット」

大規模言語モデルを活用して、自然な表情と会話の実現する「Furhatロ ...

2024年10月13日 Large language models

【WavLM】すべての音声認識モデルを過去にする！？構造や性能はどうなっているのか？

【WavLM】すべての音声認識モデルを過去にする！？構造や性能はどうな ...

2024年09月30日 Speech Processing

【構音障害者でも音声起動システムを使いたいっ！】音声起動システムのためのコーパスと音声起動システムとは？

【構音障害者でも音声起動システムを使いたいっ！】音声起動システムのため ...

2024年09月28日 Sound