人工智能下载,深度学习下载列表第248页

[深度学习] 论文笔记Unsupervised cross-domain transfer in PGRL via manifold alignment.pdf

说明：论文摘要：将策略梯度强化学习（RL）应用于困难的控制任务的成功，关键取决于确定策略明智的初始化的能力。转移学习方法通过重用从解决其他相关任务中收集到的知识来解决此问题。在多个任务域的情况下，这些算法需要任务间映射以促进跨域的知识转移。但是，当前没有通用的方法来学习任务间映射，而不需要RL设置中通常不存在的背景知识，也不需要对状态和动作的大小以指数形式进行的任务间映射的昂贵分析本文介绍了一种自治框架，该框架使用无监督的流形对齐来学习任务间映射并有效地在不同任务域之间传递样本。包括在四旋翼控制中
<liz_Lee> 上传 | 大小：1mb

[深度学习] 论文笔记—Recasting gradient-based meta-learning as hierarchical bayes

说明：论文摘要：元学习允许智能代理利用先前的学习情节作为快速提高新任务性能的基础。贝叶斯分层建模提供了一个理论框架，用于形式化元学习，作为对跨任务共享的一组参数的推断。在这里，我们重新定义了Finn等人的模型不可知元学习算法（MAML）。（2017）作为分层贝叶斯模型中概率推断的方法。与通过分层贝叶斯进行元学习的现有方法相比，MAML通过使用可扩展的梯度下降过程进行后验推理，自然适用于复杂函数逼近器。此外，将MAML识别为分层贝叶斯提供了一种将算法作为元学习过程进行理解的方法，并提供了利用计算策略进
<liz_Lee> 上传 | 大小：3mb

[深度学习] 论文笔记—Probabilistic Model-Agnostic Meta-Learning.pdf

说明：论文摘要：元学习仅需少量学习就可以获取先前的先前任务和经验，从而可以从少量数据中学习新任务。但是，短镜头学习中的一个关键挑战是任务模糊性：即使可以从大量先前任务中元学习强大的先验知识，但用于新任务的小数据集也可能太含糊而无法获取单个模型（例如，针对该任务的分类器）。在本文中，我们提出了一种概率元学习算法，该算法可以从模型分布中为新任务采样模型。我们的方法扩展了模型不可知的元学习，它通过梯度下降适应新任务，并结合了通过变分下界训练的参数分布。在元测试时，我们的算法通过将噪声注入梯度下降的简单过程进
<liz_Lee> 上传 | 大小：2mb