「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多モーダル設計 【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多 ... 2025年02月27日 Large language models
【誰もが便利さを享受するために...】whisperを利用した構音障害者音声の話者適応 【誰もが便利さを享受するために...】whisperを利用した構音障害 ... 2025年02月18日 Speech Recognition for the Dysarthric
【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽出がより効率的になるんです 【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽 ... 2025年02月14日 Speech Recognition for the Dysarthric
【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類わけされていた! 【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類 ... 2025年02月13日 Speech Recognition for the Dysarthric
【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCallコーパス” 【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCall ... 2025年02月10日 Speech Recognition for the Dysarthric
【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成技術により、誰でも簡単にネイティブ並みの発音を! 【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成 ... 2025年02月04日 Speech Recognition for the Dysarthric
【愛犬も話したZero-shot Learning】AI音声クローンとリップシンキングの検証と解説 【愛犬も話したZero-shot Learning】AI音声クローンと ... 2025年01月29日 Neural Network
PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレイアウト生成 PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレ ... 2025年01月28日 layout-gen