© 1999-2048 dssz.net 粤ICP备11031372号
[其它] python实现TF-IDF算法解析
说明:TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。 同样,理论我这里不再赘述,因为和阮一峰大神早在2013年就将TF-IDF用一种非常通俗的方式讲解出来 TF-IDF与余弦相似性的应用(一):自动提取关键词 材料 1.语料库(已分好词) 2.停用词表(哈工大停用词表) 3.python3.5 语料库的准备 这里使用的语料库是《人民日报》2015年1月16日至1月18日的发表的新闻。并且在进行TFI<weixin_38729022> 上传 | 大小:480kb