【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推論ベンチマーク 【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推 ... 2025年02月28日 Computer Vision
【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多モーダル設計 【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多 ... 2025年02月27日 Large language models
【誰もが便利さを享受するために...】whisperを利用した構音障害者音声の話者適応 【誰もが便利さを享受するために...】whisperを利用した構音障害 ... 2025年02月18日 Speech Recognition for the Dysarthric
【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理モデル”SpeechT5”の驚くべき性能とは 【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理 ... 2025年02月17日 Sound
【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽出がより効率的になるんです 【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽 ... 2025年02月14日 Speech Recognition for the Dysarthric
【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ 【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音 ... 2025年02月14日 Speech Recognition for the Dysarthric
【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類わけされていた! 【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類 ... 2025年02月13日 Speech Recognition for the Dysarthric
【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCallコーパス” 【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCall ... 2025年02月10日 Speech Recognition for the Dysarthric
【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成技術により、誰でも簡単にネイティブ並みの発音を! 【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成 ... 2025年02月04日 Speech Recognition for the Dysarthric
大規模言語モデルのスポーツの理解力を測る新データセット「SportQA」 大規模言語モデルのスポーツの理解力を測る新データセット「SportQA ... 2025年01月30日 Large language models
【愛犬も話したZero-shot Learning】AI音声クローンとリップシンキングの検証と解説 【愛犬も話したZero-shot Learning】AI音声クローンと ... 2025年01月29日 Neural Network
大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性 大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ... 2025年01月24日 Large language models