通过分子和音乐之间的相互转换产生新音乐的可能性
三个要点
✔️ 建议的分子和音乐之间的相互转换方法
✔️ 证明了相似的分子可以产生相似的音乐
✔️ 新的音乐生成可能性
Molecular Sonification for Molecule to Music Information Transfer
written by Babak Mahjour, Jordan Bench, Rui Zhang, Jared Frazier, TIMOTHY CERNAK
(Submitted on 24 Mar 2022)![]()
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
线图是最成熟的分子结构编码方法,但图形、字符串、单热编码或基于指纹的表示法等对分子的计算研究也很重要。
本文表明,音乐是一种高维的信息存储媒介,可以用来对分子结构进行编码。这实现了利用人工智能战术进行音乐生成的分子生成方法。
如果分子可以被编码为音乐,从视觉到声音的感官替代就成为可能。例如,它可以提供一种向盲人化学家展示分子的新方法。现代化学和药物发现利用了人工智能(AI),随着AI方法在音乐研究中的爆发,通过整合化学机器学习(ML)和音乐机器学习技术可以发现新的可能性。研究的动力是探索以音乐为媒介产生新分子的方法,但在研究过程中发现,分子可以为产生新音乐提供思路。
这项研究开发了一个工作流程,用于将分子转移到音乐,反之亦然。这被称为SAMPLES(用于分子生产和实时输入编码软件的声波架构)。
编码
为了创造一个基于分子结构的旋律,调子和音符的顺序分别来自物理化学特性和它们的SELFIES序列。为了确定密钥,分子的理化性质,如logP、分子量和氢键供体和受体的数量,被加在一起,最后投射到从1到12的整数,对应于一个特定的密钥。音符的顺序是由分子的SELFIES标记和大音阶的多八度音阶的一对一映射决定的。
最后的旋律是通过将旋律的MIDI数值与大调音阶的音符对应的MIDI移位来产生的。为了增强音乐质感,每一个四分音符都被转换成一个大和弦。
解读
MIDI被倒置,并在逐个键的基础上转换为分子结构。因此,同一个MIDI序列会产生多个分子结构(每个键一个)。
然后使用原始编码算法将每个分子结构散列成一个密钥。如果散列的密钥与反演计算中使用的密钥相匹配,则分子结构被解码。保证至少有一个解码键与从SAMPLES产生的MIDI相匹配。
案例研究
介绍了四个案例研究,以证明SAMPLES的有用性。
例如,从一个符合李宾斯基定律的分子产生的曲子,可以根据音乐的曲调,从听觉上区分出一个不符合该定律的分子的曲子。其原因是,分子的物理化学特性已被洗成了音乐的调子。来自DrugBank哈希的物理化学特性的指纹被哈希到音乐数据库Spotify中最流行的歌曲键上。
分子相似性的概念对化合物设计非常重要,例如当选择具有可比功能特性的分子用于药物发现时。
我们研究了从具有高Tanimoto系数的分子中产生的SAMPLES是否听起来相似,发现很难同时定义分子和音乐的相似性。
可待因(10)和吗啡(11)的样本听起来很相似。同样,磺胺甲噁唑(12)和磺胺多辛(13)的样品听起来很相似,但与10和11对不同。
第二个实验研究了通过改变音乐领域来产生分子。这在SAMPLES中是通过SELFIES应用程序实现的,它允许在生成有效分子结构的同时编辑字符串。
从吗啡(11)开始,每次可以改变一个音符,以产生新的化学结构,与吗啡有明显的关系,但键合和原子结构有明显的改变。
请注意,SAMPLES可能会产生未定义的手性中心。
在下面的案例研究中,MusicVAE的旋律混合功能被应用于作为输入的SAMPLES生成的MIDI旋律;MusicVAE可以被用来生成两个旋律之间的插值旋律。
然后,新的旋律可以通过SAMPLES返回到分子结构中,从而创造出一个新的分子,是两个分子的 "混合"。这个功能被称为CROSSFADE。通过混合分子结构或特性来创造新分子的算法是已知的,但CROSSFADE提供的互动性很有趣。
作为一个例子,谷氨酸(17)和乙酰胆碱(18)的CROSSFADE得到了(19)。同样地,例子20-28。
作为最后的实验,32名学生接受了调查。
呈现一个单一研究分子的SAMPLES歌曲,要求参与者听四个测试分子的SAMPLES歌曲并选择最相似的歌曲。(四个测试分子中的一个与调查分子有较高的Tanimoto系数)。对于所研究的四对中的三对,学生根据SAMPLES歌曲之间的相似性选择了具有最高Tanimoto系数的分子。
然而,吗啡(10)和可待因(11)的歌曲并没有被判定为具有最高的音乐相似性,尽管这些分子之间有着明显的相似性。需要进一步研究以了解其中的原因。然而,这个实验的结果强调了在没有视觉信息时,通过从视觉到听觉的感官替代进行分子解释的可能性。
摘要
一种通过音乐对有机分子进行编码的新手段已经被开发出来。它可以通过编辑、插入和删除旋律与分子结构互动,甚至可以生成新的分子结构。
本研究可用于的潜在过渡学习应用是音乐生成。机器学习用于内容生成的动机是其通用性。这意味着不需要为这类模型指定语法或规则来生成内容。
将分子转换成音乐可以提供一个音乐数据的集合,可以用来训练音乐生成模型,正如在MusicVAE中看到的那样。特别是,seq2seq模型,如RNNs,可以将包含可变长度数据信号的领域互连起来,如文本、音乐和基于结构的机器可读分子表示。
在分子的背景下,它使用变异自动编码器来学习分子特征的分布,如SELFIES标记,提供分子空间的连续嵌入 SAMPLES提供了一种将分子直接连接到音乐领域的内容生成机器学习模型的方法。
与本文相关的类别