反向传播与梯度下降的通俗解释( 六 )

  • 每次调整角度的数值和方向 , 叫做梯度 。 比如向右侧调整1毫米 , 或者向左下方调整2毫米 。 如图中的绿色矢量线 。
  • 上图是每次单发点射 , 所以每次训练样本的个数是1 。 在实际的神经网络训练中 , 通常需要多个样本 , 做批量训练 , 以避免单个样本本身采样时带来的误差 。 在本例中 , 多个样本可以描述为连发射击 , 假设一次可以连打3发子弹 , 每次的离散程度都类似 , 如图2-3所示 。

    图2-3 连发弹着点记录

    • 如果每次3发子弹连发 , 这3发子弹的弹着点和靶心之间的差距之和再除以3 , 叫做损失 , 可以用损失函数来表示 。

    那小明每次射击结果和目标之间的差距是多少呢?在这个例子里面 , 用得分来衡量的话 , 就是说小明得到的反馈结果从差9分 , 到差8分 , 到差2分 , 到差1分 , 到差0分 , 这就是用一种量化的结果来表示小明的射击结果和目标之间差距的方式 。 也就是误差函数的作用 。 因为是一次只有一个样本 , 所以这里采用的是误差函数的称呼 。 如果一次有多个样本 , 就要叫做损失函数了 。

    推荐阅读