combat-wombat-bias-in-toxicity:COMBAT WOMBAT针对Kagg

文件名称: combat-wombat-bias-in-toxicity:COMBAT WOMBAT针对Kaggle竞争性拼图在毒性分类中的意外偏见的第四名解决方案-源码

所属分类: 其它

开发工具:

文件大小: 31kb

下载次数: 0

上传时间: 2021-03-14

提供者: weixin_********

下载 (31kb)

不能下载？报告错误

详细说明：COMBAT WOMBAT 您只需运行所有train_*.py脚本，就应该能够复制解决方案并从重新训练所有模型。需要将输入数据和放到input文件夹中。 code/toxic包含train_*文件中使用的各种utils。我们最终解决方案的概述我们最终使用了33个模型的简单平均合奏： 12个基于LSTM的模型 17个BERT型号（仅基础型号） 2个基于GPT2的模型不标准的东西：我们用evey模型预测了18个目标我们结合了一些目标以获得最终分数。它正在伤害AUC，但正在改善我们关注的目标指标。 LSTM使用字符级嵌入 LSTM对不同的嵌入集进行了培训我们混合了三种不同类型的BERT：有盒，无盒和微调的ucnased（我们使用）我们试图通过一些PL使我们的模型不偏不倚。这个想法来自 GPT2模型使用的是线性分类器头的基于CNN的分类器头istead 损失我们以

(系统自动生成,下载前可以参看下载内容)