「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推論ベンチマーク 【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推 ... 2025年02月28日 Computer Vision
【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多モーダル設計 【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多 ... 2025年02月27日 Large language models
【誰もが便利さを享受するために...】whisperを利用した構音障害者音声の話者適応 【誰もが便利さを享受するために...】whisperを利用した構音障害 ... 2025年02月18日 Speech Recognition for the Dysarthric
【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理モデル”SpeechT5”の驚くべき性能とは 【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理 ... 2025年02月17日 Sound
【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽出がより効率的になるんです 【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽 ... 2025年02月14日 Speech Recognition for the Dysarthric
【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ 【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音 ... 2025年02月14日 Speech Recognition for the Dysarthric
【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類わけされていた! 【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類 ... 2025年02月13日 Speech Recognition for the Dysarthric
【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCallコーパス” 【便利さの享受は平等であれ!】構音障害者音声コーパス”EasyCall ... 2025年02月10日 Speech Recognition for the Dysarthric
【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成技術により、誰でも簡単にネイティブ並みの発音を! 【誰でも英語が話せる時代到来!?】多言語に対応したゼロショット音声合成 ... 2025年02月04日 Speech Recognition for the Dysarthric
戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic Chain-of-Thought)が登場! 戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic ... 2025年02月03日 Chain-of-Thought
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
StrongSORT: DeepSORTが強くなって帰ってきた!アップグレードされた追尾モデル! StrongSORT: DeepSORTが強くなって帰ってきた!アップ ... 2022年12月31日 Object Tracking