结合知识图谱和强化学习的新型可解释艺术家推荐系统。
三个要点
✔️ 结合知识图谱和强化学习来解决向用户推荐艺术家的问题。
✔️ 推荐的原因可以通过跟踪代理人的搜索路径推断出来。
✔️ 比知识图谱注意力网络(KGAT)的性能更好,它结合了知识图谱和图谱神经网络。
Explainable artist recommendation based on reinforcement knowledge graph exploration
written by Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama
(Submitted on 30 April 2022)
Comments: Accepted by IWAIT2022
Subjects: Machine Learning (cs.LG)
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
音乐的数字化和音乐发行服务的普及,增加了聆听各种艺术家的音乐的机会。此外,在不久的将来,使用非可移植代币(NFT)的数字数据销售预计将迅速蔓延。然而,目前网络市场上的音乐推荐技术往往不以用户为导向。例如,不难想象,受欢迎的艺术家比拥有核心粉丝的艺术家更有可能被推荐,因为他们对销售的贡献更大。因此,人们利用深度学习设计了更多面向用户的推荐技术,这也引发了近年来的人工智能热潮。然而,深度学习通常缺乏可解释性,因此很难提供一个艺术家被推荐的理由。本文提出了一种新的艺术家推荐技术,通过考虑代理在知识图谱上探索的模型,可以为结果提供理由。
这项研究的新颖之处在于两个方面
- 因为提出了一种新的艺术家推荐方法,结合了知识图谱和强化学习。
- 事实上,一个可解释的艺术家推荐系统是通过学习知识图谱上的最佳路径实现的。
知识图谱
知识图谱是一种以网络结构形式表示事件(实体)及其关系的信息的图。注意,这里的图是指由顶点和连接顶点的边组成的数据结构。一个知识图谱的具体例子是:"日本的首都是东京"。用一个图形表示,"首都 "的边从标有 "日本 "的顶点延伸到标有 "东京 "的顶点。一般来说,这种三元关系(三联体)被表示为(日本、首都、东京都)。由于知识图谱$mathcal{G}$是一个三元关系的集合,它可以由以下公式定义,其中$mathcal{N}$是事件集合,$mathcal{E}$是关系集合。
在本文中,知识图谱是由以下三种类型的三元关系构建的
$(u_i, e_{(u_i, m_j)}, m_j)$: 用户$u_i$听到了歌曲$m_j$。
$(a_k, e_{(a_k, m_j)}, m_j)$: 艺术家$a_k$创作了歌曲$m_j$。
$(m_j, e_{(m_j, g_l)}, g_l)$:歌曲$m_j$属于流派$g_l$。
因此,知识图谱在图示中看起来是这样的。
嵌入知识图谱
为了利用知识图谱,事件和关系需要被嵌入到低维矢量空间中。已经提出了各种知识图谱嵌入的方法,但在本文中,我们使用了一种叫做TransE的方法,对于三元关系$(n_i, e, n_j)$的每个嵌入表示$mathbf{n}_i, \mathbf{e}, \mathbf{n}_j$是学会满足下面的方程。
\i + \mathbf{n}_i = \mathbf{e} = \mathbf{n}_j]。
使用强化学习在知识图谱上进行搜索。
该方法训练代理从用户的顶点到达艺术家的顶点。代理人被放置在用户的顶点进行推荐,无论边的方向如何,都可以自由探索知识图。还会给予以下奖励,以帮助代理人到达适当的艺术家顶点。
其中$mathcal{M}(in\{m_1,m_2,\dots,m_{N_m}})$是曲线的集合,$mathbf{e_{fw}}(u_i, n_t)$是顶点$u_i$到顶点$n_t$之间的边的嵌入表示之和,$mathbf{e_{bw}(u_i, n_t)$ 是从顶点$n_t$ 到顶点$u_i$ 的边的嵌入表示的总和。
下图概述了薪酬的计算方法。
总而言之,该方法包括以下三个步骤
- 从数据中创建知识图谱。
- 使用TransE计算顶点和边的嵌入表示。
- 让代理人在知识图谱上进行探索,找到一条推荐路径。
实验结果
该实验使用Spotify百万播放列表数据集进行了评估。这个数据集包含57,880首歌曲,1,006个用户,14,973个艺术家和2,517个流派。使用的比较方法是知识图谱注意力网络(KGAT),这是一种基于知识图谱和图谱神经网络的推荐方法。结果如下表所示,显示KGAT的表现优于KGAT。
评价指标的计算方法如下。
其中$P_{10}^{u_i}$是用户$u_i$听到的歌曲中,由用户$u_i$推荐的前10名艺术家的数量。
问责制
图3显示了一些推荐路径的例子。在例1和例2中,用户推荐了一个与他们以前听过的歌曲相同类型的艺术家。例3和例4推荐的艺术家,其歌曲以前曾被其他听过同一首歌的用户听过。这样一来,这种方法在一定程度上可以通过查看代理人所遵循的路线来推断出推荐的原因。
摘要
在这项研究中,通过让代理在知识图谱上进行探索,提出了一个具有可解释性的新型艺术家推荐系统。所提出的方法不仅提高了可解释性,而且还超过了基于图神经网络的推荐系统KGAT。
本文为艺术家推荐系统提供了一个新的方向。然而,在奖励设计和知识图谱嵌入方法方面还有改进的余地,看看未来的研究如何发展将是非常有趣的。
与本文相关的类别