您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Lucene 原理 介绍

  2. Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:...
  3. 所属分类:其它

    • 发布日期:2009-05-12
    • 文件大小:2048
    • 提供者:zhuansky008
  1. 全文检索技术研究与应用论文

  2. 全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文检索的有关技术进行了较为深入的研究。在基于字表的全文索引方面,本文提出了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新。本文的重点放在了全文检索技术的应用上,对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、加快检速度、不断适应网络信息发展等方面做了重点研究。
  3. 所属分类:网络基础

    • 发布日期:2009-06-29
    • 文件大小:123904
    • 提供者:java_zhu
  1. Hadoop倒排索引程序

  2. 这是一个在hadoop集群环境下的文档倒排程序。数据源是莎士比亚文集(运行是需要设置)
  3. 所属分类:Java

    • 发布日期:2011-07-12
    • 文件大小:6144
    • 提供者:xiaopihai_001
  1. mapreduce建索引

  2. 共享一个关于mapreduce框架建立简单的倒排索引的文档
  3. 所属分类:Java

    • 发布日期:2011-10-09
    • 文件大小:1048576
    • 提供者:wuaixu1
  1. 十五个经典算法研究与总结、目录+索引

  2. 十五个经典算法研究集锦+目录 一、A*搜索算法 一(续)、A*,Dijkstra,BFS算法性能比较及A*算法的应用 二、Dijkstra 算法初探 二(续)、彻底理解Dijkstra算法 二(再续)、Dijkstra 算法+fibonacci堆的逐步c实现 二(三续)、Dijkstra 算法+Heap堆的完整c实现源码 三、动态规划算法 四、BFS和DFS优先搜索算法 五、教你透彻了解红黑树 (红黑数系列六篇文章之其中两篇) 五(续)、红黑树算法的实现与剖析 六、教你初步了解KMP算法、up
  3. 所属分类:其它

  1. Lucene建立索引

  2. 使用lucene,建索引。倒排索引现在在搜索引擎涌出很大,本工程为入门提供参考
  3. 所属分类:Java

    • 发布日期:2013-04-17
    • 文件大小:4194304
    • 提供者:lucheng918
  1. 信息索引技术

  2. 顺排检索 倒排索引 后缀数组索引 文本压缩技术
  3. 所属分类:其它

    • 发布日期:2013-05-28
    • 文件大小:1048576
    • 提供者:gsglwang88
  1. 十五个经典算法研究与总结(目录+索引)

  2. 本经典算法研究系列,涵盖A*.Dijkstra.DP.BFS/DFS.红黑树.KMP.遗传.启发式搜索.图像特征提取SIFT.傅立叶变换.Hash.快速排序.SPFA.快递选择SELECT等15个经典基础算法,共计31篇文章,包括算法理论的研究与阐述,及其编程的具体实现。很多个算法都后续写了续集,如第二个算法:Dijkstra 算法,便写了4篇文章;sift算法包括其编译及实现,写了5篇文章;而红黑树系列,则更是最后写了6篇文章,成为了国内最为经典的红黑树教程。 OK,任何人有任何问题,欢迎随
  3. 所属分类:C

    • 发布日期:2014-09-06
    • 文件大小:14680064
    • 提供者:l_j_kin
  1. 基于hadoop搜索引擎 离线处理程序

  2. 本项目是基于hadoop搜索引擎的离线处理程序,主要包含三部分 1.网页信息过滤 2.生成倒排索引文件 3.生成二级索引文件;
  3. 所属分类:Java

    • 发布日期:2014-10-20
    • 文件大小:31457280
    • 提供者:long1657
  1. lucene索引结构与时空优化

  2. 第一章 Lucene是个倒排索引 第二章 Lucene与数据库 第三章 Lucene的索引建立及文件结构 第四章 Lucene的检索机制及文档得分 第五章 Lucene的存储优化 第六章 Lucene的效率优化 第七章 用Lucene加快web开发!
  3. 所属分类:Java

    • 发布日期:2015-07-08
    • 文件大小:586752
    • 提供者:u011488251
  1. 构建索引并实现对文档集合的检索

  2. 基于java语言,用lucene实现对文档集的索引和收索。要求对不少于3篇文章进行向量的构建,并将产生的文档向量及文档倒排索引输出或保存在文件中。 要求对检索式构建检索向量,并输出文档与检索向量的相关度,以及文档按照相似度的排序结果。 数据要求为不少于3篇的、有一定长度的任意英文文段,要求为真实有意义的文段,由代码实验者自行给定。
  3. 所属分类:Java

    • 发布日期:2015-10-27
    • 文件大小:115712
    • 提供者:qq_31417531
  1. 倒排索引引擎

  2. 数据库索引
  3. 所属分类:Access

    • 发布日期:2017-05-24
    • 文件大小:604160
    • 提供者:kjsoftware
  1. 搜索引擎的混合索引技术

  2. 摘 要 倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词 典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾, 论文在天网搜索引擎的实践基础上, 提出了一 种基于倒排文件实现的混合索引的方法, 它可以有效提高搜索引擎下短语查询的检索效率, 同时不影响系统检索效果。
  3. 所属分类:专业指导

    • 发布日期:2009-03-16
    • 文件大小:102400
    • 提供者:lewque
  1. 大数据下空间数据索引和KNN查询技术

  2. 基于Map Reduce模型,本文将网格空间划分和倒排索引相结合,首次提出了一种新的分布式倒排网格索引结构。该索引结构扁平化、松耦合的特点,使其更加适合索引大规模空间数据和进行分布式化处理。同时,我们在Map Reduce 框架下实现了分布式倒排网格索引结构并详细描述了Map 和Reduce 的过程。基于该索引结构,本文对传统的kNN 查询算法进行了 改进,提出了一种新的可并行的查询算法ParallelC ircle Trip 算法。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-11-10
    • 文件大小:92274688
    • 提供者:lhcluster
  1. MySQL全文索引实现简单版搜索引擎实例代码

  2. 前言 只有Innodb和myisam存储引擎能用全文索引(innodb支持全文索引是从mysql5.6开始的) char、varchar、text类型字段能创建全文索引(fulltext index type) 全文索引的基于关键词的,如何区分不同的关键词了,就要用到分词(stopword) 英文单词用空格,逗号进行分词;中文分词不方便(一个句子不知道怎样区分不同的关键词) 内置分词解析器ngram支持中文,日文,韩文(将句子分成固定数字的短语) 当对表写入大量数据时,
  3. 所属分类:其它

    • 发布日期:2020-12-15
    • 文件大小:106496
    • 提供者:weixin_38649356
  1. 信息检索:使用trie和反向索引实现基本的搜索引擎-源码

  2. 家庭作业4:信息检索 CS 201数据结构II,2020年Spring 本作业探讨通过trie和反向索引的实现来检索信息。 提供了骨架代码。 目的 该作业提供对trie和反向索引数据结构以及信息检索领域的洞察力。 背景 对于此作业,您应该 了解特里数据结构及其相关操作 了解倒排索引数据结构及其相关操作 适应面向对象的编程 熟悉使用高级语言(最好是python)进行编程 能够解决问题 问题集 问题集以.tex和.pdf形式存在于资源库中。 贡献 在这两个小组成员中,Swaleha致力于实现trie
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:9437184
    • 提供者:weixin_42137539
  1. 时间序列数据库的秘密(二)——索引

  2. Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在18和30之间,性别为女性这样的组合查询。倒排索引很多地方都有介绍,但是其比关系型数据库的b-tree索引快在哪里?到底为什么快呢?笼统的来说,b-tree索引是为写入优化的索引结构。当我们不需要支持快速的更新的时候,可以用预先排序等方式换取更小的存储空间,更快的检索速度等好处,其代价就是更新慢。要进一步深入的化,还是要看一下Lucene的倒排索引是怎么构成的。这里
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:532480
    • 提供者:weixin_38558623
  1. 时间序列数据库的秘密(二)——索引

  2. Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在18和30之间,性别为女性这样的组合查询。倒排索引很多地方都有介绍,但是其比关系型数据库的b-tree索引快在哪里?到底为什么快呢?笼统的来说,b-tree索引是为写入优化的索引结构。当我们不需要支持快速的更新的时候,可以用预先排序等方式换取更小的存储空间,更快的检索速度等好处,其代价就是更新慢。要进一步深入的化,还是要看一下Lucene的倒排索引是怎么构成的。这里
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:532480
    • 提供者:weixin_38610070
  1. xedni:此项目实现了反向索引,通常用于提供全文本搜索-源码

  2. 倒排索引API 介绍 一种使用倒排索引实现有效搜索功能的API。 倒排索引不是将文档对象映射到它包含的术语数组,而是将术语映射到包含它的文档数组。 换句话说,倒排索引包含每个文档中每个单词的频率。 入门 在本地构建和运行 git clone https://github.com/tsvetinaSpasova/xedni.git cd xedni make go-run 从文档创建索引 cd examples ./index.sh 搜索词项索引 cd examples ./search.sh
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:37888
    • 提供者:weixin_42133452
  1. 用Python中的字典来处理索引统计的方法

  2. 最近折腾索引引擎以及数据统计方面的工作比较多, 与 Python 字典频繁打交道, 至此整理一份此方面 API 的用法与坑法备案.     索引引擎的基本工作原理便是倒排索引, 即将一个文档所包含的文字反过来映射至文档; 这方面算法并没有太多花样可言, 为了增加效率, 索引数据尽可往内存里面搬, 此法可效王献之习书法之势, 只要把十八台机器内存全部塞满, 那么基本也就功成名就了. 而基本思路举个简单例子, 现在有以下文档 (分词已经完成) 以及其包含的关键词 doc_a: [word_w,
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:70656
    • 提供者:weixin_38590784
« 1 2 3 4 56 7 8 9 10 ... 14 »