Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶
Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer
Task05:卷积神经网络基础;leNet;卷积神经网络进阶
过拟合、欠拟合及其解决方案
一类是模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting);
另一类是模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合(overfitting)。
在实践中,我们要尽可能同时应对欠拟合和过拟合。虽