Ultra-Sparse Memory Network:Transformerの記憶効率を変える新手法 Ultra-Sparse Memory Network:Transfo ... 2025年06月23日 LLM-Paper
Do I Know This Entity? Knowledge Awareness and Hallucinations in ... Do I Know This Entity? Knowledge Aw ... 2025年06月19日 LLM-Paper
MagicDriveDiT: High-Resolution Long Video Generation for Autonomo ... MagicDriveDiT: High-Resolution Long ... 2025年06月16日 LLM-Paper
Patience Is The Key to Large Language Model Reasoning Patience Is The Key to Large Langua ... 2025年06月12日 LLM-Paper
「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推論ベンチマーク 【SOK-Bench】動画における実世界の知識を活用した状況的ビデオ推 ... 2025年02月28日 Computer Vision
【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多モーダル設計 【Libra】分離型ビジョンシステムを用いた大規模言語モデルの新たな多 ... 2025年02月27日 Large language models
【誰もが便利さを享受するために...】whisperを利用した構音障害者音声の話者適応 【誰もが便利さを享受するために...】whisperを利用した構音障害 ... 2025年02月18日 Speech Recognition for the Dysarthric
【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理モデル”SpeechT5”の驚くべき性能とは 【常識を覆す音声処理モデル!?】Microsoft社が開発する音声処理 ... 2025年02月17日 Sound
【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽出がより効率的になるんです 【こんなところにwav2vec2を使うのっ!?】構音障害音声の特徴量抽 ... 2025年02月14日 Speech Recognition for the Dysarthric
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
AIエージェントの性能を評価する包括的なベンチマーク、AgentBenchが登場! AIエージェントの性能を評価する包括的なベンチマーク、AgentBen ... 2023年09月21日 agent simulation
StrongSORT: DeepSORTが強くなって帰ってきた!アップグレードされた追尾モデル! StrongSORT: DeepSORTが強くなって帰ってきた!アップ ... 2022年12月31日 Object Tracking