マルチエージェントによる共同作業を可能にするフレームワーク、MindAgentが登場！

agent simulation 2023年10月10日

3つの要点
✔️ LLMの共同作業を促進するマルチエージェントプランニングフレームワークであるMindAgentを設計
✔️ LLMのマルチエージェントプランニングの性能を評価するためのベンチマークであるCUISINEWORLDと評価指標であるCollaboration Score(CoS)を提案
✔️ 比較実験の結果、作業を行うエージェント数が増えるほど作業効率とタスク達成率が高くなることが実証された

MindAgent: Emergent Gaming Interaction
written by Ran Gong, Qiuyuan Huang, Xiaojian Ma, Hoi Vo, Zane Durante, Yusuke Noda, Zilong Zheng, Song-Chun Zhu, Demetri Terzopoulos, Li Fei-Fei, Jianfeng Gao
(Submitted on 18 Sep 2023 (v1), last revised 19 Sep 2023 (this version, v2))
Comments: The first three authors contributed equally. 28 pages
Subjects: Artificial Intelligence (cs.AI); Human-Computer Interaction (cs.HC); Multiagent Systems (cs.MA)

code：

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

はじめに

近年、大規模言語モデル(LLM)のマルチエージェントシステムにおける高度なタスクを完了するために複雑なスケジューリングを実行し、生成エージェントを調整することができるプランニング能力に注目が集まっています。

一方で、既存研究で広く扱われているシングルエージェントに比べ、マルチエージェントによるプランニングは行動空間が指数関数的に増大する(エージェント数が増加する)ため、複雑性が非常に高くなるという課題がありました。

このような理由から、これまでシングルエージェントにおいて多くのゲームフレームワークが導入されているにも関わらず、一般的なマルチエージェントのためのベンチマークは不十分でした。

本稿では、こうした背景からLLMの複数のエージェントとの共同作業を促進するマルチエージェントプランニングフレームワークであるMindAgentを設計し、新しいベンチマークであるCUISINEWORLDと評価指標であるCollaboration Score(CoS)を提案し、様々な条件下での包括的な実験を行った論文について解説します。

CUISINEWORLD

本論文では、LLMのマルチエージェントプランニングにおける性能を評価するために、下図の左に示すCUISINEWORLDというベンチマークを提案しています。

詳しく見ていきましょう。

Task

CUISINEWORLDは仮想のキッチンの環境を模したゲームであり、複数のエージェントに対して様々な調理器具や食材を使い、限られた時間内にできるだけ多くの注文をこなすように命令します。

与えられる注文には27種類の食材からなる33種類の料理が設定されており、マグロの身を切るだけで作れるマグロの刺身から、様々な調理器具を必要とするポークパスタのような料理まで様々です。

これらの料理を調理する難易度に基づいてグループ分けすることで、12段階のゲームレベルを設定しています。

タスクの開始時にタスクリストに料理の注文が追加されていき、一致する料理が食卓に並べられるとタスクが完了したと見なされ、リストから料理が排除されます。

一方で、制限時間(料理の複雑さによって異なる)に達するとタスク失敗とみなされ、この場合もリストから料理が排除されます。

このような設計により、新しい注文がどんどん入ってくる一方で、既存の注文は時間切れになる前に調理しなければならないため、LLMは複数のエージェントを適切にプランニングし、全体の生産性を最大化することが求められます。

Human-Agent Collaboration

CUISINEWORLDはテキストインターフェースを備えた設計になっているため、エージェント同士だけでなく人間とエージェントの共同作業も可能となっています。

加えて、標準的なキーボードを使用してプレイヤーを操作することに加えて、下図の一番下の画像のようにVRデバイスを使用することも可能です。

このVR機能により、ユーザーは3D環境でプレイヤーや調理器具などのゲーム内要素を物理的に動かし、エージェントとの共同作業を行う事ができるため、より没入感のあるリアルなインタラクションが可能となっています。

Collaboration Score(CoS)

本論文では、CUISINEWORLDにおいてLLMが複数のエージェントをどの程度プランニングし、料理の注文を完了させることができるかを評価するための指標であるCollaboration Score(CoS)を提案しています。

CoSは以下の式で定義されています。

ここで、T_intは最大ステップ数Tで設定されたCUISINEWORLDにおいて新しい注文がタスクリストに追加されるステップ数(＝task interval)を、Mは評価するtask intervalの総量を表しています。(デフォルトではM=5)

このことから、CoSはCUISINEWORLD内のtask intervalが異なる様々な条件間でのタスクの平均完了率を表しており、このスコアが高いほどマルチエージェント間の共同作業の効率が高いことを示しています。

MindAgent: Infrastructure For Gaming AI

本論文では、LLMの複数のエージェントとの共同作業を促進することを目的とした、マルチエージェントプランニングフレームワークであるMindAgentを設計しています。

MindAgentのアーキテクチャを下図に示します。

図が示すように、MindAgentのアーキテクチャはPlanning Skills&Tool use・Action・LLM・Memoryの4つのモジュールから構成されています。

CUISINEWORLDのゲーム環境では、タスクを完了するために多様なプランニングスキルとツールの使用が必要となり、Planning Skills&Took useモジュールは、こうしたスキルと関連するゲーム情報を発信します。

加えて、関連するゲームデータを構造化されたテキスト形式に変換し、LLMが処理できるようにします。

Actionモジュールは、テキストの入力からアクションを抽出し、ドメイン固有の言語に変換するのに加え、DSL(Domain Specific Language, ドメイン固有言語)を検証し、実行時にエラーを引き起こさないようにする役割があります。

LLMモジュールはマルチエージェントシステムのDispatcher(指令係)であり、その他のモッジュールから送信される情報を元に意思決定を行います。

Memoryモジュールは、Memory Historyと呼ばれる場所に時間ステップごとに環境の状態とエージェントの状態を記録する役割があります。

これらのモジュールとIn-context Learning(パラメータを更新することなく、タスク説明や入出力から行う学習)に従った設計により、MingAgentはマルチエージェントにおけるプランニング能力を向上させています。

Experiments and Results

本論文では、CUISINEWORLDにおいてLLMのマルチエージェントにおける性能を調べるために様々な条件下での実験を行いました。(全ての実験はOpenAI APIとanthropic APIを使用して実行されました)

下の表は、異なるタスクレベル(very simple・simple・intermidiate・advanced)における異なるエージェント数(2〜4体)ごとのタスク達成率とCoSを表したものになります。

表が示すように、異なるタスクレベルにおいてエージェントの数が多いほどタスクの作業効率(CoS)が高くなることが確認できます。

加えて、どのタスクレベル・エージェント数においても、タスクが少ない場合にはタスク達成率が低く、タスク数が増えていくにつれてタスク達成率が安定していくことが確認されました。

これは、4つのモジュールとIn-context Learningにより設計されたMindAgentフレームワークにより、タスクをこなすたびにLLMがマルチエージェントにおけるプランニング能力を向上させた結果だと推測できます。

加えて下図は、異なるタスクレベル(level0〜9)とエージェント数(2〜4体)でのタスク成功率を表したものになります。

図に示すように、異なるタスクレベルにおいて、一般的にエージェントの数が多いほど作業効率が高くなる(グラフの傾きが大きくなる)ことが確認できます。

これらの実験結果は、LLMがより多くのエージェントを調整し、より効率的にタスクを実行できる可能性を示しており、今後の研究につながる非常に重要な示唆を得ることができました。

まとめ

いかがだったでしょうか。今回は、LLMの複数のエージェントとの共同作業を促進するマルチエージェントプランニングフレームワークであるMindAgentを設計し、新しいベンチマークであるCUISINEWORLDと評価指標であるCollaboration Score(CoS)を提案し、様々な条件下での包括的な実験を行った論文について解説しました。

本論文ではLLMのマルチエージェントにおけるプランニング能力を調査し、今後の研究につながる様々な結果を得たことに加えて、CUISINEWORLDにてVR環境での人間の操作を可能にするなど、人間とAIがシームレスに共同作業を行う未来のゲームシステムの開発にも注力していました。

著者は、本論文の洞察と発見が技術的進歩だけでなく、プレイヤーにとってより魅力的で楽しいゲームを作るためのきっかけなるかもしれないと語っており、本論文がゲーム分野の進展につながることにも期待が寄せられます。

今回紹介したCUISINEWORLDやMindAgentのアーキテクチャの詳細は本論文に載っていますので、興味がある方は参照してみてください。