100kトークン以上の長文のみから構成された書籍要約のためのデータセット、FABLESが登場! 100kトークン以上の長文のみから構成された書籍要約のためのデータセッ ... 2024年08月23日 Large language models
LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが登場! LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが ... 2024年08月22日 Simulation Platform
スプレッドシートを用いたタスクを自動で行うLLMエージェント、SheetAgentが登場! スプレッドシートを用いたタスクを自動で行うLLMエージェント、Shee ... 2024年05月28日 ChatGPT
集団における文化的進化をLLMでシミュレートするためのフレームワークが登場! 集団における文化的進化をLLMでシミュレートするためのフレームワークが ... 2024年05月27日 Cultural evolution
AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができるかを評価するベンチマークが登場! AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができる ... 2024年05月27日 ChatGPT
LLMが「心の理論」を有しているかを評価するベンチマーク、OpenToMが登場! LLMが「心の理論」を有しているかを評価するベンチマーク、OpenTo ... 2024年05月24日 Datasets
多様なエージェント同士を討論させることで、GPT-4を超える性能を引き出すフレームワークが登場! 多様なエージェント同士を討論させることで、GPT-4を超える性能を引き ... 2023年10月12日 agent simulation
マルチエージェントによる共同作業を可能にするフレームワーク、MindAgentが登場! マルチエージェントによる共同作業を可能にするフレームワーク、MindA ... 2023年10月10日 agent simulation