メンタルヘルスケア領域で最も精度がいいLLMはどれか:Mental-LLM メンタルヘルスケア領域で最も精度がいいLLMはどれか:Mental-L ... 2023年09月15日 Large language models
AIエージェント同士を議論させる評価フレームワーク、ChatEvalが登場! AIエージェント同士を議論させる評価フレームワーク、ChatEvalが ... 2023年09月15日 agent simulation
AIがシステム開発を一貫して行うマルチエージェントフレームワーク、MetaGPTが登場! AIがシステム開発を一貫して行うマルチエージェントフレームワーク、Me ... 2023年09月13日 agent simulation
AIエージェントがソフトウェア開発を行う仮想の会社「CHATDEV」を設立!? AIエージェントがソフトウェア開発を行う仮想の会社「CHATDEV」を ... 2023年09月06日 agent simulation
新データセット「ToolQA」:大規模言語モデルが外部ツールで問題解決する能力を評価 新データセット「ToolQA」:大規模言語モデルが外部ツールで問題解決 ... 2023年08月28日 Large language models
仮想環境でAIエージェントと他者の共同作業をシミュレーションするためのフレームワークが登場! 仮想環境でAIエージェントと他者の共同作業をシミュレーションするための ... 2023年08月25日 agent simulation
複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すアプローチが登場! 複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すア ... 2023年08月24日 agent simulation
ChatGPT(GPT-3.5とGPT-4)の性能が変化している?スタンフォード大学とカリフォルニア大学バークレー校の研究チームが ... ChatGPT(GPT-3.5とGPT-4)の性能が変化している?スタ ... 2023年08月23日 Large language models
大規模言語モデルはテキスト評価のタスクにおいて、人間の代わりになり得るのか? 大規模言語モデルはテキスト評価のタスクにおいて、人間の代わりになり得る ... 2023年08月02日 Large language models