目录

1.算法目标

2.算法描述

3.算法推导

4.注意


1.算法目标

逐渐逼近损失函数 loss 的极小值,简单抽象为求函数随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客的极小值。

2.算法描述

每次取一个增量随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客,使得随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客,每次向函数值更小的地方前进一小步,多次迭代就能做到逐渐逼近函数随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客的极小值。

3.算法推导

展开随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客 得到公式随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客

其中H为海森矩阵,暂且不考虑。为使随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客成立,只需要保证随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客

即,当随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客时,随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客,如此即可保证每次更新在逐渐逼近函数的极小值。其中随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客 为学习率是一个较小的正数。

每次更新时做 随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客 操作,求得随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客的最小值。

4.注意

上述过程是在逼近极小值,不一定是函数的最小值。

随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客是一种下降趋势,整个循环步骤中函数值随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客随机梯度下降算法原理 知乎_梯度下降算法的正确步骤-风君雪科技博客在下降,并非每个小步骤得到的函数值都比前一次要小。