《未来学徒》:怎么让人工智能记住并且在人群中认出你?( 四 )

不妨简单解释一下LSTM的工作原理。

LSTM区别于RNN的地方,主要就在于它在算法中加入了一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell。

一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用。只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘。

说起来无非就是一进二出的工作原理,却可以在反复运算下解决神经网络中长期存在的大问题。目前已经证明,LSTM是解决长序依赖问题的有效技术,并且这种技术的普适性非常高,导致带来的可能性变化非常多。各研究者根据LSTM纷纷提出了自己的变量版本,这就让LSTM可以处理千变万化的垂直问题。

LSTM的应用空间

LSTM虽然没有多么复杂,但应用率却非常高。例如这项技术已经被证明有效的应用环境就是在文本理解与翻译领域。

LSTM的最直接价值体现,就是根据上下文之间的关键信息,来推断后序文本当中出现的主体定义。这就让机器翻译更有可能处理较长的文本甚至整个故事。

推荐阅读