您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. GlomImpl:文本的GLOM模型的实现-源码

  2. 格洛姆 这是针对文本域的GLOM模型()的简单实现。 它很大程度上建立在ALBERT模型的上()。 方法 使用t变压器层(t =您要建模的GLOM时间步数) 使用L个关注头(L =您要建模的GLOM级别数) 将这些小修改应用于ALBERT模型: 删除查询,键,值的线性投影; 只需通过[(d/L)*i..(d/L)*(i+1)]到第i个头 修改/约束关注的密集层,使其输出的每个分区[(d/L)*i..(d/L)*(i+1)]仅由(第i-1),第i和第(i + 1)头(这将模拟对较低和较高GL
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:207kb
    • 提供者:weixin_42127020