您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. sphinx算法分析

  2. 本文对sphinx代码中涉及到的一部分算法进行说明,以便在阅读代码的时候,能更容易理解相关的代码。本文所整理的是其中的部分算法。
  3. 所属分类:网管软件

    • 发布日期:2012-02-13
    • 文件大小:24kb
    • 提供者:kamo54
  1. 快速构建PHP全文检索——马明练

  2. 信息检索,全文检索,IR基础,反向索引,同步机制,批量处理检索比较 全文检索数据库LKE 索引使用事先建好的全文索引用不到索引,只能遍历匹配 % eight%也会匹配 height 匹配效笑/通过分词器切割匹配,良好\9m%me就不能匹配颠 支持中文、英文词干 倒的ⅹx.net. XXX. COm 相关度基于概率模型的相关性算无相关算法,匹配一次或多次 法,越相关的排在越前面 无明显区别 可定制通过定制分词器,实现不同 索引规则 难以定制 结论支持大数据,性能高效果好/效率低,相关性差,模糊检索
  3. 所属分类:PHP

    • 发布日期:2019-03-04
    • 文件大小:1mb
    • 提供者:danyidanfei
  1. document-analyzer:POC NLP项目,在一组文档中查找最常用的术语-源码

  2. 文件分析仪 总览 文档分析器是一种交互式脚本,可以分析一组文档并找到这些文档中最常用的重要术语(单词或词干)。 产品特点 它支持的功能有: 分析一组文档并找出最常用的重要术语 异步运行分析,使用celery生成可以并行运行的多个作业,以减少执行时间。 词干查找在文档集中最重要的词干 交互式CLI使过程更容易。 可能缺少什么 理想情况下,我还希望包含: 单元测试 更好的文档(sphinx和autodoc) 更好的输出格式(HTML&Chart.js) 将文档更优雅地传输给工作人员(现在,
  3. 所属分类:其它