说明: 该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名
<yuqilong> 上传 | 大小:429kb