最近在看知乎,看到有些内容挺好的,摘录一下
原文链接:https://zhuanlan.zhihu.com/p/25005808
https://medium.com/@karpathy/yes-you-should-understand-backprop-e2f06eab496b
SGD中的S(stochastic)代表什么
随机啊,还能代表什么?
It is called stochastic because each small set of examples gives a noisy estimate of the average gradient over all examples.
它被称为随机因为每个小例子集都给出了所有例子中平均梯度的有噪音的估计。