机器学习系列(八)- 优化梯度下降法

梯度下降法优化方法

随机梯度下降法($mini-batch$)

牛顿法

一维情况

image-20211208170023018

多维情况

image-20211208173419429

牛顿法将多维数据同时考虑计算,计算量极大;以下方法均依次考虑单个维度。

动量法(冲量法)

$Nesterov$ 方法(牛顿冲量法)

$AdaGrad$ 方法

$RMSprop$ 方法

$Adam$ 方法

$Nadam$ 方法