LiveMCPBench:大規模ツール環境でLLMエージェントを評価する新たなベンチマーク LiveMCPBench:大規模ツール環境でLLMエージェントを評価す ... 2025年08月28日 LLM-Paper
Goedel-Prover-V2:自己修正と段階的データ合成による効率的な自動定理証明の新展開 Goedel-Prover-V2:自己修正と段階的データ合成による効率 ... 2025年08月27日 LLM-Paper
複数人会話映像生成の新展開!MITデータセットとベースラインモデル『CovOG』 複数人会話映像生成の新展開!MITデータセットとベースラインモデル『C ... 2025年08月27日 LLM-Paper
ToolTrain:LLMによるリポジトリ深層探索とIssue Localizationの新手法 ToolTrain:LLMによるリポジトリ深層探索とIssue Loc ... 2025年08月25日 LLM-Paper
FlashAttention対応のトークン圧縮『Representation Shift』の仕組みと効果 FlashAttention対応のトークン圧縮『Representat ... 2025年08月25日 LLM-Paper
CompassVerifier:LLM解答検証を革新する新たなベンチマークと堅牢モデル CompassVerifier:LLM解答検証を革新する新たなベンチマ ... 2025年08月24日 LLM-Paper
Skywork UniPic:高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル Skywork UniPic:高効率で画像理解・生成・編集を統合する次 ... 2025年08月13日 LLM-Paper
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
MATE:マルチエージェントによるアクセシビリティ特化モダリティ変換フレームワーク MATE:マルチエージェントによるアクセシビリティ特化モダリティ変換フ ... 2025年08月12日 LLM-Paper
Biomed-Enriched:LLM注釈で臨床・教育価値を高めたバイオメディカル大規模データセット Biomed-Enriched:LLM注釈で臨床・教育価値を高めたバイ ... 2025年08月12日 LLM-Paper
Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロンプト技術の提案 Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロ ... 2025年07月30日 LLM-Paper