数学模型如下。单个 M-P 神经元能够实现 16 种逻辑函数,对于深度学习的重要性就像门电路对于计算机。
$$ y = f\left( \sum_{n=1}^N w_nx_n - \theta \right) = f(\hat {\boldsymbol w}^{\rm T} \boldsymbol x_+) $$
激活函数 $f$:最理想的形态其实是阶跃函数,但是不连续、不光滑、不能逆向传播,实际使用类似于「S」形的函数(被称作 Sigmoid 函数),常用的激活函数如下图。
$$ {\rm Sigmoid: } \ \ \ f(x) = \frac {1}{1 + e^{-x}}, \ \ \ f'(x) = f(x)(1-f(x)) $$
随机初始权重。
链式梯度传播。
梯度下降策略:以目标的负梯度方向对参数进行调整。
$$ \Delta w = -\eta \frac{\partial E}{\partial w} $$
终止条件。
$$ E = \sum_{m=1}^M \frac 12 \|{\hat {\boldsymbol y}^{(m)}} - {\boldsymbol y^{(m)}} \|_2^2 $$