伊莱克特拉
Wikipedia上的数据集:
Fazer或下载;
使用脚本进行通用转换,然后将WikiExtractor转换为xml em或documento json;
python - m WikiExtractor ptwiki - latest - pages - articles . xml . bz2 - - json
Lar o arquivo json com o comando abaixo ao inpésde usar o pandas devido ao tam
|
科勒克特拉
Replaced Token Detection ,生成了Replaced Token Detection ,并区分了“真实”令牌,“伪造”令牌,更新了令牌。 输入令牌和密码,BERT以及보다。
KoELECTRA 는 34GB 의 한 국 어文字로 학 습 하 였 고 , 이 를 통 해 나 온 KoELECTRA-Base 와 KoELECTRA-Small 두 가 지 모 델 을 배 포 하 게 되 었 습 니 다 。
在Koelectra上下载Wordpiece