华为推出AI诗人“乐府”:唐诗宋词都不在话下( 四 )

与自由生成文本不同,生成中国的古诗词是一个挑战,通常需要满足形式和内容两个方面的要求。

中国的古诗词有各种各样的形式,比如五绝、七绝、五律、七律、满江红、西江月、水调歌头等各种词牌以及对联,每一种都有相应的字数、押韵、平仄、对仗等规定;

内容方面虽然简单,但要求更加难以琢磨:一首诗要围绕着一个主题展开,内容上还要具有连贯性。

华为提出的“乐府”系统,与当前大多数解决方案不同,不需要任何人工设定规则或者特性,也没有设计任何额外的神经元组件。

华为推出AI诗人“乐府”:唐诗宋词都不在话下

整个研究中,需要做的就是把训练用的诗词序列化为格式化的文本序列,作为训练数据。

然后通过对语言模型token的抽样,生成满足形式和内容要求的诗词,比如绝句、律诗、词,以及对联等等。

而且,他们还提出并实现了一种对模型进行微调以生成藏头诗的方法。

推荐阅读