© 1999-2048 dssz.net 粤ICP备11031372号
[机器学习] 基于Word2Vec的一种文档向量表示_唐明.pdf
说明:基于Word2Vec的一种文档向量表示。在文本分类中,如何运用 word2vec词向量高效地表达一篇文档一直是一个难点。目前,将 word2vec模型与 聚类算法结合形成的doc2vec模型能有效地表达文档信息。但 是,这种方法很少考虑单个词对整篇文档的影响力。 为了解决这个问题,利用 TF-IDF算法计算每篇文档中词的权重,并结合 word2vec词向量生成文档向量,最后将其应 用于中文文档分类。在搜狗中文语料库上的实验验证了新方法的有效性。<zk12141985> 上传 | 大小:340kb