Bilibili: https://www.bilibili.com/video/BV1MRJmzSEaa
神经网络的中间层相当于“黑箱”,不用知道也不太能知道“特征”都是什么
神经元死亡:激活函数始终没有激活
平均绝对误差(Mean Absolute Error, MAE) / L1 Loss
对异常值鲁棒
0处不可导
均方误差(Mean Squared Error, MSE) / L2 Loss
对异常值敏感(平方放大异常值)
Smooth L1
±1之间用L2,以外用L1
交叉熵误差(Cross Entropy Error)
损失函数取最小值 → 当前为最优参数
导数的极限没有那么极限之后
x —forward→ y
x + h —forward→ y’
h不能太小,小心浮点误差
不用单独的x + h 来求,用x ± h的两个点求,误差更小