多层感知机(MLP,Multilayer Perceptron)也叫人工神经网络(ANN,Artificial Neural Network),除了输入输出层,它中间可以有多个隐层,最简单的MLP只含一个隐层,即三层的结构,如下图最简单的MLP:
上图模型pyTorch代码:
import torch
from torch.nn import functional as F
x = torch.randn(1, 10) # 输入x的特征有10个
w = torch.randn(3, 10,
深度学习入门-4(机器翻译,注意力机制和Seq2seq模型,Transformer)一、机器翻译1、机器翻译概念2、数据的处理3、机器翻译组成模块(1)Encoder-Decoder框架(编码器-解码器)(2)Sequence to Sequence模型(3)集束搜索(Beam Search)(ⅰ)简单贪心搜索(greedy search)(ⅱ)维特比算法(ⅲ)维特比算法二、注意力机制框架和Seq2seq模型1、注意力机制的引入2、注意力机制框架3、两个常用的注意力层(1)点积注意力(The d