Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロンプト技術の提案 Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロ ... 2025年07月30日 LLM-Paper
RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成データ生成とベンチマーク設計 RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成デ ... 2025年07月29日 LLM-Paper
性質ベースのテストでLLMコード生成を強化!自己欺瞞を断ち切る新フレームワークPGS 性質ベースのテストでLLMコード生成を強化!自己欺瞞を断ち切る新フレー ... 2025年07月29日 LLM-Paper
推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
スプレッドシートを用いたタスクを自動で行うLLMエージェント、SheetAgentが登場! スプレッドシートを用いたタスクを自動で行うLLMエージェント、Shee ... 2024年05月28日 ChatGPT
AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができるかを評価するベンチマークが登場! AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができる ... 2024年05月27日 ChatGPT