物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦 物理とデジタルを融合する次世代AI『Embodied Web Agen ... 2025年07月05日 LLM-Paper
多話者音声認識の新潮流!DiCoWとDiariZenによる高精度システムの挑戦 多話者音声認識の新潮流!DiCoWとDiariZenによる高精度システ ... 2025年07月03日 LLM-Paper
Ultra-Sparse Memory Network:Transformerの記憶効率を変える新手法 Ultra-Sparse Memory Network:Transfo ... 2025年06月23日 LLM-Paper
「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推論ベンチマーク 【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推 ... 2025年02月28日 Computer Vision
【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多モーダル設計 【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多 ... 2025年02月27日 Large language models