平安首创AVM自动变奏模型,探秘全球首部AI交响变奏曲背后硬核技术( 三 )

此外,过去的多个 AI 生成的结果都带有同样的弊病:仅能实现一种曲风。以谷歌在巴赫诞辰日的产品为例,AI 仅能根据人们输入的旋律进行巴赫风格的模仿,无法换成其他风格。

而据平安研究院介绍,他们的人工智能算法使用了 VAE 模块,其目的就是为了让模型能够根据用户提出的语义信息要求,调整模型的超参数,使得最终生成的乐曲符合用户的需求。这样一来,AI 实现了真正意义上的「按需谱曲」,而不是带着以模仿为核心功能的传声筒。

谱曲到演奏的「最后一公里」由人类专家完成

要保证生成的曲子在实际演出达到预期效果,这是有相当大难度的。

首先,如何将语义信息利用 AI 融入曲子中呢?利用神经网络强大的拟合能力,平安人工智能研究院选择了数万个旋律片段,并根据其表达的情感打上情感标签,然后在模型中使用 transformer 进行训练。这样一来,隐层向量可以学习到特定模式的旋律所对应的语义标签信息,对谱曲中设定好的语义要求进行旋律上的关联。

另一个问题则是 AI 谱曲和真实演奏之间出现的断层问题。我们知道,很多时候序列的生成时不太好控制和约束,难免会出现异常的音符旋律组合。这样会导致 AI 生成的结果无法在实际中进行演奏。例如,一些音符的组合对于人类而言难以演奏(比如指法无法切换),或者生成的旋律不符合乐理规律等。

推荐阅读