推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
10億人のペルソナから構築された大規模データセット、Persona Hubが登場! 10億人のペルソナから構築された大規模データセット、Persona H ... 2024年12月19日 persona-driven data synthesis
100kトークン以上の長文のみから構成された書籍要約のためのデータセット、FABLESが登場! 100kトークン以上の長文のみから構成された書籍要約のためのデータセッ ... 2024年08月23日 Large language models
LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが登場! LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが ... 2024年08月22日 Simulation Platform
スプレッドシートを用いたタスクを自動で行うLLMエージェント、SheetAgentが登場! スプレッドシートを用いたタスクを自動で行うLLMエージェント、Shee ... 2024年05月28日 ChatGPT
集団における文化的進化をLLMでシミュレートするためのフレームワークが登場! 集団における文化的進化をLLMでシミュレートするためのフレームワークが ... 2024年05月27日 Cultural evolution
AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができるかを評価するベンチマークが登場! AIエージェントがユーザーの暗黙的な意図をどれだけ汲み取ることができる ... 2024年05月27日 ChatGPT
LLMが「心の理論」を有しているかを評価するベンチマーク、OpenToMが登場! LLMが「心の理論」を有しているかを評価するベンチマーク、OpenTo ... 2024年05月24日 Datasets
多様なエージェント同士を討論させることで、GPT-4を超える性能を引き出すフレームワークが登場! 多様なエージェント同士を討論させることで、GPT-4を超える性能を引き ... 2023年10月12日 agent simulation