赶上最新的AI论文

现在出现了一种方法,通过赋予法学硕士多重角色来激发他们解决问题的卓越技能!

现在出现了一种方法,通过赋予法学硕士多重角色来激发他们解决问题的卓越技能!

代理模拟

三个要点
✔️提出了 "独奏表演提示法"(SPP),这是一种通过多个角色的反复反馈来利用法学硕士的各种专业知识的方法
✔️ 发现分配多个详细的角色可以利用法学硕士高超的问题解决技能
✔️ 与 "思维链提示 "的比较实验证明了 SPP 的有效性

Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration
written by Zhenhailong WangShaoguang MaoWenshan WuTao GeFuru WeiHeng Ji
(Submitted on 11 Jul 2023 (v1), last revised 14 Jul 2023 (this version, v2))
Comments: work in progress

Subjects: Artificial Intelligence (cs.AI); Computation and Language (cs.CL)

code: 
 

本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。

介绍。

虽然大型语言模型(LLM)在生成代理以解决常见任务方面表现出色,但诸如幻觉(LLM 输出似是而非的谎言事实错误(LLM 输出似是而非的谎言,但事实却被误解的现象等问题仍然存在。错误(LLM 输出似是而非的谎言)和事实错误(LLM 误解事实的现象)等问题。

由于存在这些问题,与人类可以利用不同的认知过程和整合信息的能力(即认知协同)不同,当今的法律硕士更像是 "万事通",可以说是汇集了大量的知识。

此外,思维链提示和自我完善等最新研究成果通过生成中间步骤和迭代修正,成功地增强了 LLM 推理,但内部知识获取中的幻觉和事实错误仍是主要挑战。事实错误仍然是主要挑战。

为了解决这些问题,本文作者认为产生认知协同者是一种有效的方法,这种智能代理可以把多个角色联系起来,融合他们独特的能力和专业知识,从而在复杂的任务中提高解决问题的能力和整体效率。我们认为这种方法是有效的。

本文提出了"独奏表现提示SPP)"--一种通过重复多个角色的反馈将单个语言学习者转变为认知协同者的方法并介绍了一篇论文,该论文通过对比实验发现,在语言学习者中分配多个详细的角色可以激发出更好的问题解决能力论文介绍了通过对比实验发现,在 LLM 中分配多个详细的角色可以激发出更好的解决问题的能力。

独奏表演提示

下图说明了思维链提示法(一种传统的提示方法)与独奏表演提示法(SPP)(目前的方法)之间的区别。

最大的区别在于,SPPLLM 生成的单个代理转变成了一个认知协同者,它可以动态地设置角色,并根据反馈对角色进行修改,从而有效地解决各种任务

根据任务输入动态识别和模拟不同角色的结构,可以提高解决问题的能力和完成复杂任务的整体表现,并有效地激发 LLM 的内部知识。

下图提供了一个具体实例,说明 SPP 如何在需要整合不同领域信息的更具挑战性的任务中发挥作用,例如游戏《塞尔达传说》、电影《哈利-波特》和歌手周杰伦的专辑。

现有的标准提示因遗漏重要信息或事实错误而无法提供足够的输出,而 SPP 则允许拥有特殊角色的参与者(如哈利-波特迷或周杰伦迷)根据自己的专业知识就如何完成任务提出建议。通过就如何完成任务提出建议,可以获得适当的信息。

然后,领导者角色,即人工智能助手(用户),会提出一个初始解决方案,征求其他参与者的反馈意见,根据反馈内容反复修改解决方案,并输出最终解决方案。

这些序列包括三个要素:角色识别开头备注多角色迭代协作

角色识别

在输入信息的基础上,SPP 首先会生成一份不同角色的参与者名单,这些角色对任务解决方案可能是有效的。

例如,在上述具体示例中,"歌手周杰伦第二张专辑的最后一首歌是什么?生成一个周杰伦粉丝的角色来搜索 "歌手周杰伦第二张专辑的最后一首歌是什么?

此外,这里的角色不是人工定义的,而是由语言模型自动定义的。

开头备注

在语言模型生成各种角色后,用户作为人工智能助手提出第一个解决方案,然后每个角色从自己的角度陈述如何完成任务。

在上文提到的具体例子中,周杰伦的粉丝发表声明,指出周杰伦第二张专辑的最后一首歌是《安靖》。

通过这些声明的反复修改,可以有效地改进人工智能助手最初提出的解决方案。

多角色迭代协作

在人工智能助手提出初步解决方案后,其他参与者提供反馈意见,人工智能助手则重复修改解决方案的过程,一遍又一遍,直到所有参与者都对最终解决方案感到满意为止。

完成这一过程后,就会输出"完成协作!"的字样,并生成最终解决方案。

这种结构使 SPP 能够有效地获取领域知识,并减少仅基于单一大规模语言模型的幻觉。

实验(琐事创意写作任务)。

为了证明本文提出的独奏性能提示(SPP)的有效性,我们使用以下任务与思维链提示(CoT)进行了对比实验。(所有实验均使用 GPT-4-32K API)

下图所示的 "琐事创意写作任务"要求范文就该主题绘制一个连贯的主要故事,其中包含 N 个琐事问题的答案。

由于 N 越大,涉及的问题越多,因此模型需要诱导出更多的领域知识,本文的实验是在 N=5 和 N=10 两种评估环境下进行的。

实验结果(N=5)如下图所示。

从图中可以看出,CoTs 虽然尝试制定合理的计划来解决任务,但最终的答案却出现了事实错误和幻觉等问题,而 SPPs 则能够恰当地回答问题

此外,值得注意的是,当 N=10 时,这些改进比 N=5 时更明显,这表明,对于需要从大量不同领域获取知识的任务来说,生成各种角色以利用不同专业知识的 SPP 更有效

摘要

结果如何?在这篇文章中,我们提出了独奏表演提示(SPP),这是一种通过多个角色反复提供反馈,将单个LLM转化为认知协同者的方法,并描述了一篇论文,其中比较实验发现,在LLM中分配多个详细的角色,可以激发出更好的问题解决绩效。这篇论文介绍了在比较实验中发现在 LLM 中分配多个详细的角色能激发出更好的解决问题的能力。

虽然本文进行的对比实验证明了该方法与现有方法相比是有效的,但仍然存在一些问题,比如即使分配了详细的角色,答案也可能不准确

此外,"角色 "的分配在多大程度上可以增加特定领域的知识,目前还不清楚,而且由于需要专业的诊断来量化这些 "角色 "的影响,未来的趋势将受到密切关注。

本文所介绍的独奏表演提示和实验的详情可参见本文,如有兴趣,请参阅本文。

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!

如果您对文章内容有任何改进建议等,请通过 "联系我们 "表格与爱学网编辑部联系。
如果您能通过咨询表与我们联系,我们将非常感激。

联系我们