您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DAY2-《动手学深度学习》(PyTorch版)

  2. Task03: 过拟合和欠拟合 一类是模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting); 另一类是模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合(overfitting)。 在实践中,我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题,在这里我们重点讨论两个因素:模型复杂度和训练数据集大小。 模型复杂度 为了解释模型复杂度,我们以多项式函数拟合为例。给定一个由标量数据特征x和对应的标量标签y组成的训练数据集,多项式函数拟合
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:179kb
    • 提供者:weixin_38677260
  1. ElitesAI·动手学深度学习PyTorch版Task03打卡

  2. Task3打卡 1、过拟合、欠拟合及其解决方案 目录: 相关的基本概念 权重衰减 过拟合、欠拟合解决方法 1、相关的基本概念 训练误差: 模型在训练数据集上表现出的误差。 泛化误差: 模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。 欠拟合(underfitting): 模型无法得到较低的训练误差。 过拟合(overfitting): 模型的训练误差远小于它在测试数据集上的误差。 注:在实践中,我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:432kb
    • 提供者:weixin_38641876
  1. ElitesAI·动手学深度学习PyTorch版-第二次打卡task03

  2. 1、卷积神经网络基础: 1.1 二维卷积操作: 二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。卷积核的尺寸通常小于输入数组,卷积核在输入数组上滑动,在每个位置上,卷积核与该位置处的输入子数组按元素相乘并求和,得到输出数组中相应位置的元素。图1展示了一个互相关运算的例子,阴影部分分别是输入的第一个计算区域、核数组以及对应的输出。 其中。卷积核为2:heavy_m
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:923kb
    • 提供者:weixin_38718262
  1. ElitesAI·动手学深度学习PyTorch版(第二次打卡)

  2. • Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸 知识点 1.训练误差(training error)和泛化误差(generalization error) 训练误差:训练数据集上表现出的误差 泛化误差:模型在测试数据样本上表现出的误差 验证误差:我们可以预留一部分在训练数据集和测试数据集以外的数据代入模型求得得误差。训练数据集和测试数据集以外的数据被称为验证数据集,简称验证集(validation set) 2.过拟合、欠拟合 欠拟合(underfitting):模型无法得到较
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:424kb
    • 提供者:weixin_38523728
  1. 动手学深度学习实现DAY-2

  2. 节选自“ElitesAI·动手学深度学习PyTorch版” Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶(1天) Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer(1天) Task05:卷积神经网络基础;leNet;卷积神经网络进阶(1天) 过拟合、欠拟合及其解决方案 过拟合、欠拟合的概念 权重衰减 丢弃法 模型选择、过拟合和欠拟合 训练误差和泛化误差 在解释上述现象之前,我们需要区分训练误差(training err
  3. 所属分类:其它

  1. 动手学深度学习Pytorch版Task03

  2. 过拟合、欠拟合及其解决方案 1.概念 无法得到较低的训练误差称作欠拟合 得到的误差极小即远小于训练集的误差称作过拟合 2.模型选择 验证数据集 从严格意义上讲,测试集只能在所有超参数和模型参数选定后使用一次。不可以使用测试数据选择模型,如调参。由于无法从训练误差估计泛化误差,因此也不应只依赖训练数据选择模型。鉴于此,我们可以预留一部分在训练数据集和测试数据集以外的数据来进行模型选择。这部分数据被称为验证数据集,简称验证集(validation set)。例如,我们可以从给定的训练集中随机选取一小
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:159kb
    • 提供者:weixin_38623366
  1. 动手学深度学习(Pytorch版)task3-5打卡

  2. 对于task3-5的内容进行打卡 Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶 模型复杂度和误差之间的关系 权重衰减的计算公式: Xavier初始化 梯度裁剪 循环神经网络中较容易出现梯度衰减或梯度爆炸,这会导致网络几乎无法训练。裁剪梯度(clip gradient)是一种应对梯度爆炸的方法。假设我们把所有模型参数的梯度拼接成一个向量 g ,并设裁剪的阈值是 θ 。裁剪后的梯度为: GRU 重置门用于捕捉时间序列里的短期依赖关系 更新门有助于捕捉时间
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:755kb
    • 提供者:weixin_38735790