
在 35% 的情况下,LLM 代理都能成功引导客户购买!
三个要点
✔️ 提出一个多代理框架,分析客户情绪和说服信息,并以相关事实做出回应
✔️ 利用两个代理(销售代理和用户代理)全面分析 LLM 模型说服用户的能力
✔️ 实验结果表明,销售代理促使用户代理做出积极决定的可能性提高了 35
Persuasion Games with Large Language Models
written by Ganesh Prasath Ramani, Shirish Karande, Santhosh V, Yash Bhatia
(Submitted on 28 Aug 2024 )
Comments: Published on arxiv.
Subjects: Artificial Intelligence(cs.AI); Computation and Language(cs.CL)
code:
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
大型语言模型(LLMs)的最新进展促使各行各业开发了代理,以协助客户选择符合其特定要求的产品。
这些代理善于了解客户的喜好,还能回答有关各种程序、法律合同、旅行计划和日程安排的询问。
另一方面,为了促使客户采取预期行动
- 通过对话持续分析用户情绪和信息。
- 与用户产生共鸣,说服他们改变或考虑建议
而实现这些目标的机制至今尚未开发出来。
为了解决这些问题,本文提出了一个多代理框架,其中主代理通过说服对话与用户直接接触,辅助代理则执行信息检索、响应分析和事实验证等任务,并全面分析了 LLM 代理的说服能力。本文对此进行了阐述�
说服框架
在构建框架时,本文重点关注 "说服 "这一要素。
本文中的 "说服 "指的是诱导个人根据特定意图或观点改变其信念和行为的技术,被广泛应用于各个领域,如影响消费者选择的商业活动和争取支持的政治活动。
本文提出了 "说服框架",这是一个用于持续分析信息并动态回应相关事实以提高用户情感和说服力的框架。
该框架的工作流程如下图所示。
该框架主要由四个不同的代理组成:对话代理、分析代理、检索代理和策略代理,销售代理(如下所述)通过访问这些代理来执行任务。这些代理通过访问它们来执行任务。
工作流程开始时,销售代理首先向用户打招呼,说明对话的目的和要发送给对方的信息。
收到用户信息后,分析器代理会对信息中的情绪进行分类,检索器代理会找到检索到的信息,以帮助其做出有效回应。
然后,分析器代理和检索代理向对话代理提供反馈,对话代理拥有最终决定权。
与此同时,战略家代理使用 RAG 检查专家形成的映射规则,如果没有,则使用 LLM 制定战略,并将其传达给销售代理。
销售代理的回复在与事实核查器检索到的信息核对无误后,就会发送给用户。
设置
本文按照下述设置创建了店主方的销售代理和顾客方的用户代理,并使用三个评估指标来衡量说服的有效性。
销售代理
每个销售代理使用 gpt-4、gpt-4o 或 gpt-4o-mini 中的一种,并在每个纪律中执行以下任务之一。
- 银行代理: 根据用户偏好推荐信用卡,并说服他们购买高级卡
- 保险代理人: 说服用户向其推销对其有用的合适保险单
- 投资顾问代理: 向用户推销现代投资方法,让他们了解传统投资和现代投资的风险、收益和区别。
这些任务的销售代理提示如下。
用户代理
用户代理使用现有研究中的提示创建了 25 个不同的角色,并通过 gpt-4 和 gpt-4o 进行了模拟。
此外,在每个会话开始时,会为用户代理分配随机的情绪和动机,以模拟受近期新闻影响时的变化。
用户代理提示如下
评估指标
本文通过以下三个评估指标来衡量说服的有效性
- 调查: 要求用户代理在对话前后填写调查问卷,并通过两者之间的差异来衡量销售代理的说服效果。
- 行动:向用户代理提供五种行动: 购买、感兴趣、访问网站、需要更多详情和不购买,并通过每种行动来衡量说服的效果。
- 语言分析: 从第三人称视角分析整个对话,并使用 LLM,通过预定义的评估批判来衡量销售代理的说服效果
实验
本文在店主方的 3 个销售代理和顾客方的 25 个用户代理之间生成了 300 个对话,随机选择了用户代理的情绪,并测量了每个对话的得分。
此外,还在中性情绪(无情绪提示)的代理之间生成了对话,并将获得的 75 分作为基准。
下图显示了实验中用户代理的每个操作的决策百分比。
当 "购买"、"感兴趣 "和 "访问网站 "被认为是积极的购买行为,而 "需要更多详情 "和 "不购买 "被认为是消极的购买行为时,销售代理诱导用户代理做出积极决策的可能性在基线时提高了 35%,而在启用情感因素时提高了 28%。诱导用户做出积极决策。
此外,按任务分列的用户代理对话时长如下图所示。
从图中可以看出,用户代理的情绪会影响对话的时长,中性情绪(基线)比情绪(实验)导致的对话时长更长。
这是因为当出现 "被欺骗 "或 "被背叛 "等强烈情绪时,用户代理倾向于结束对话,这一结果与真实世界的模拟结果一致。
摘要
结果如何?在这篇文章中,我们介绍了一篇论文,该论文提出了一个多代理框架,其中主代理通过说服对话与用户直接接触,而辅助代理则执行信息检索、响应分析和事实验证等任务,并全面分析了 LLM 代理的说服能力。
在本文进行的实验中,有很多情况下用户代理会因为 Salse 代理提供的信息不足而结束对话,结果表明仍有改进的余地。
同时,作者还表示,他们计划通过增强销售代理的记忆力,并允许用户代理在对话过程中检索数据,使对话更具活力。
随着这项研究的发展,客服行业可能很快就会被人工智能代理所取代。
本文所介绍的框架和实验结果的详情可参见本文,有兴趣者可参阅。
与本文相关的类别