中文命名实体识别
数据集
本项目尝试使用了多种不同的模型(包括HMM,CRF,Bi-LSTM,Bi-LSTM + CRF)来解决中文命名实体识别问题,数据集用的是论文ACL 2018 中收集的简历数据,数据的格式如下,它的每个行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行替换。
美 B-LOC
国 E-LOC
的 O
华 B-PER
莱 I-PER
士 E-PER
我 O
跟 O
他 O
谈 O
笑 O
风 O
生 O
该数据集就位于项目目录下的ResumeNER文件夹里
复式
简介
诺萨历史
一份2020年科普研究计划书,对理想国进行重新编码。第07班。
诺萨·米桑(NossaMissão)
Criamos umaaplicaçãoque vai conectar pessoas que livingm em moradias流行一种舟桥。 Alémde levarmos称其为soc reciclagem,是指根据实际情况获得的比索税。 实施预防措施的必要条件(armazenagem,coleta,质控物/比索,物权法令)。
诺索斯·瓦洛雷斯(Nossos V