向量空间检索(VSM)模型
已实施此向量空间检索模型,以评估TREC的小型基准文档集合上的算法,该模型已由NLTK / StanfordNLP进行了预处理。小规模数据集还包含TREC主题(即查询)的一部分及其对这些文档的判断(即qrels)。
这三个代码(invidx.py,printdict.py和vecsearch.py)都使用以下基本的python库/包-os,string,math,pickle和xml.etree.ElementTree。
用法
程序将按以下顺序执行-invidx.