?马尔可夫性质和马尔可夫链的一个直观且简单的解释


?马尔可夫性质和马尔可夫链的一个直观且简单的解释


文章图片


?马尔可夫性质和马尔可夫链的一个直观且简单的解释


文章图片


?马尔可夫性质和马尔可夫链的一个直观且简单的解释


文章图片



马尔可夫链出现在许多领域 , 如物理、遗传学、金融 , 还有数据科学和机器学习 。 它是自然语言处理和强化学习中的一个典型的统计技术 。 在本文中 , 我们将简单地解释什么是马尔可夫链 。
马尔可夫性质
对于任何马尔可夫的建模过程 , 它必须满足马尔可夫性质 。 这个性质表示下一个状态的概率仅取决于当前状态(与当前状态之前的一切都是无关的) 。 换句话说 , 整个系统是“完全无记忆”的 。
从数学上讲 , 这可以写成:

其中n为时间步长参数 , X为在给定状态空间s中取某一值的随机变量 。 状态空间是指一个事件的所有可能结果 。 例如 , 一枚硬币在其状态空间中有两个值:s = {正 , 反 , 从一种状态转换到另一种状态的概率是0.5 。
马尔可夫链
使用马尔可夫性质的过程称为马尔可夫过程 。 如果状态空间是有限的 , 我们使用离散时间步 , 这个过程被称为马尔可夫链 。 换句话说 , 它是一个随机变量序列在给定的状态空间中呈现的各种状态 。
在本文中 , 我们将讨论时间齐次离散时间马尔科夫链 , 因为它们是最容易使用和理解的 。 非齐次时间马尔可夫链状态间的转移概率不固定 , 且随时间变化 。
下面是一个带有状态空间{A , B , C的马尔可夫链的例子 。 箭头上的数字表示在这两种状态之间转换的概率 。

【?马尔可夫性质和马尔可夫链的一个直观且简单的解释】例如 , 如果想从状态B到状态C , 那么这个转变的概率是20% 。 从数学上讲 , 我们可以得出如下结论:

概率转换矩阵
我们可以通过构造给定马尔可夫链的概率转换矩阵来简化这些转换 。 转换矩阵有i行和j列 , 因此i , j的索引值给出了从i到j的转换概率为:

上述马尔可夫链的转换矩阵为:

在这篇文章中 , 我简单介绍了马尔可夫性质和概念 , 并利用这个概念来构造和理解一个基本的马尔可夫链 。 这个随机过程出现在数据科学和机器学习的许多方面 , 所以熟悉它是很有必要的 。

    推荐阅读