© 1999-2048 dssz.net 粤ICP备11031372号
[其它] pos.mecab-ipadic.zip
说明:mecab 是基于CRF 的一个日文分词系统,代码使用 c++ 实现, 基本上内嵌了 CRF++ 的代码, 同时提供了多种脚本语言调用的接口(python, perl, ruby 等).整个系统的架构采用通用泛化的设计, 用户可以通过配置文件定制CRF训练中需要使用的特征模板。 甚至, 如果你有中文的分词语料作为训练语料,可以在该架构下按照其配置文件的规范定制一个中文的分词系统。 日文NLP 界有几个有名的开源分词系统, Juman, Chasen, Mecab. Juman 和 Chase<weixin_44216734> 在 上传 | 大小:26214400