引言
今天分享的内容有:首先聊聊深度学习中存在的过拟合、欠拟合现象,以及梯度消失、梯度爆炸等。其次,分享一个本人梳理的卷积神经网络、循环神经网络代码结构。
过拟合、欠拟合
模型的泛化能力是深度学习的一大问题,所谓泛化能力就是模型在训练数据集和测试数据集上的表现情况。泛化能力强的模型,在训练数据集和测试数据集上都具有良好的表现;泛化能力差的模型,往往在训练集上表现良好(或在训练数据集上表现也很差),同时,在测试数据集上的表现也同样差强人意。若泛化能力的模型主要分为两类:(1)如果在训练集表现差,在