缓解文本中的性别偏见
设置该存储库的目的是提供对代码和数据的访问,该代码和数据用于编写和论文 。 的原始论文利用进行培训,评估和文本生成。 这些论文中使用的模型是一个88M参数转换器,具有16个关注头,8个编码器层,8个解码器层,并且嵌入大小为512。该模型在具有大约17亿评论的数据集上进行了预训练。 在本文进行的所有实验中,都使用某种形式的数据增强或训练在数据集上对该预训练模型进行了微调,以减轻游戏对话中的性别偏见。 在大型语料库中,文本可能包含性别偏见,模型可以从中学习并生成性别偏见的文本。