您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 51CTO下载-lucene-analyzers-3.0.1.jar

  2. 建立倒排索引的重要核心代码,介绍代码中的核心思想并且附上了流程图
  3. 所属分类:Java

    • 发布日期:2015-11-04
    • 文件大小:200704
    • 提供者:crystalstart
  1. json-org.jar

  2. 艺术第二十六章:基于给定的文档生成倒排索引的编码与实践的整个工程源码
  3. 所属分类:JavaME

    • 发布日期:2015-11-09
    • 文件大小:36864
    • 提供者:u013933040
  1. lucene-core-4

  2. 倒排索引的java实现,对于已经转化为txt的网页文档使用IK分词,然后建索引
  3. 所属分类:Java

    • 发布日期:2015-12-09
    • 文件大小:2097152
    • 提供者:crystalstart
  1. mapreduce例子

  2. 本文讲述了6个mapreduce例子,数据去重,数据排序,平均成绩,单表关联,多表关联,倒排索引
  3. 所属分类:讲义

    • 发布日期:2015-12-10
    • 文件大小:1048576
    • 提供者:zhanglu1236789
  1. 信息检索:实现和评价搜索引擎

  2. 《信息检索:实现和评价搜索引擎》从多个视角对信息检索技术进行了深入讲解,内容涵盖了信息检索系统的架构、基础技术、词条和词项、静态和动态倒排索引、查询处理、索引压缩技术、概率模型、语言模型、分类和过滤、融合和元学习、评价方法以及并行信息检索、Web检索和XML检索等具体应用。本书以模块化的方式进行组织,理论性强,体系完整,同时强调实践。作者以认真严谨的态度实现了书中绝大部分的主要方法,并详尽地描述了各种方法的适用环境以及取得的效果。
  3. 所属分类:专业指导

    • 发布日期:2015-12-18
    • 文件大小:46137344
    • 提供者:mayway530
  1. 协同过滤算法的实现

  2. 包括如下步骤: 1.首先将文件读入,对数据集的基本的统计,并构建Item-User的倒排索引表 2.计算用户的评分的平均值。 3.计算用户之间的相似度。 4.选取最近的10%的邻居用户。 5.用这些用户的评分进行预测。
  3. 所属分类:C++

    • 发布日期:2016-05-23
    • 文件大小:7168
    • 提供者:u011332819
  1. IKSegment分词源码

  2. 可以将一篇文档分词,完成词频统计,制作总词表,制作倒排索引表。
  3. 所属分类:Java

    • 发布日期:2017-06-17
    • 文件大小:1048576
    • 提供者:lianyun017
  1. elasticsearch-5.6.0.tar.gz

  2. elasticsearch-5.6.0.tar.gz,这个资源官网太难下载,所以放到这里供大家下载.elasticsearch 实时搜索工具,倒排索引
  3. 所属分类:Java

    • 发布日期:2017-09-15
    • 文件大小:33554432
    • 提供者:kaige8312
  1. elasticsearch-5.6.0.zip

  2. elasticsearch-5.6.0.zip下载太慢,借助csdn下子快点,倒排索引实时搜索工具,Elasticsearch: RESTful, Distributed Search & Analytics | ...
  3. 所属分类:Java

    • 发布日期:2017-09-15
    • 文件大小:33554432
    • 提供者:kaige8312
  1. 搜索引擎技术核心详解

  2. 网络搜索引擎的核心介绍,较为详尽的讲解了爬虫技术、倒排索引等核心技术
  3. 所属分类:其它

    • 发布日期:2017-10-08
    • 文件大小:35651584
    • 提供者:liguangyang1987
  1. 程序员编程艺术:面试和算法心得.pdf

  2. 第一部分 数据结构 • • • 第一章 字符串 o 1.0 本章导读 o 1.1 旋转字符串 o 1.2 字符串包含 o 1.3 字符串转换成整数 o 1.4 回文判断 o 1.5 最长回文子串 o 1.6 字符串的全排列 o 1.10 本章习题 第二章 数组 o 2.0 本章导读 o 2.1 寻找最小的 k 个数 o 2.2 寻找和为定值的两个数 o 2.3 寻找和为定值的多个数 o 2.4 最大连续子数组和 o 2.5 跳台阶 o 2.6 奇偶排序 o 2.7 荷兰国旗 o 2.8 矩阵相
  3. 所属分类:C

    • 发布日期:2017-11-16
    • 文件大小:4194304
    • 提供者:xjj7540916
  1. Elasticsearch+技术解析与实战-1

  2. Elasticsearch+技术解析与实战 前言 第1章 Elasticsearch入门  1.1 Elasticsearch是什么   1.1.1 Elasticsearch的历史   1.1.2 相关产品  1.2 全文搜索   1.2.1 Lucene介绍   1.2.2 Lucene倒排索引  1.3 基础知识   1.3.1 Elasticsearch术语及概念   1.3.2 JSON介绍  1.4 安装配置   1.4.1 安装Java   1.4.2 安装Elasticsear
  3. 所属分类:kafka

    • 发布日期:2017-12-29
    • 文件大小:104857600
    • 提供者:avyou55
  1. Elasticsearch+技术解析与实战-2

  2. Elasticsearch+技术解析与实战 前言 第1章 Elasticsearch入门  1.1 Elasticsearch是什么   1.1.1 Elasticsearch的历史   1.1.2 相关产品  1.2 全文搜索   1.2.1 Lucene介绍   1.2.2 Lucene倒排索引  1.3 基础知识   1.3.1 Elasticsearch术语及概念   1.3.2 JSON 介绍  1.4 安装配置   1.4.1 安装Java   1.4.2 安装Elasticsea
  3. 所属分类:kafka

    • 发布日期:2017-12-29
    • 文件大小:16777216
    • 提供者:avyou55
  1. luke-src-0.8.1源码

  2. luke-src-0.8.1源代码,JAVA代码,查看倒排索引
  3. 所属分类:Java

    • 发布日期:2008-12-28
    • 文件大小:1048576
    • 提供者:lwfldn
  1. lucene搜索引擎【代码以及jar包】

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点:   (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。   (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。   (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。   (4)设计了独立于语言和文件格式的文本分
  3. 所属分类:Java

    • 发布日期:2009-02-06
    • 文件大小:1048576
    • 提供者:chickenlove
  1. 对知识元进行向量表示

  2. 对知识元进行向量化,接着可用来进行SVM训练
  3. 所属分类:专业指导

    • 发布日期:2009-03-16
    • 文件大小:5242880
    • 提供者:kaoba
  1. performance of compressed inverted list caching

  2. 倒排索引压缩方式的性能比较,包括vbyte s9 s16 pfordelta rice entropy 等算法
  3. 所属分类:VB

    • 发布日期:2009-04-24
    • 文件大小:2097152
    • 提供者:icow
  1. 基于分布式数据库的图像检索系统

  2. DIRS: Distributed Image Retrieval System === 本项目实现了基于分布式数据库的图像检索系统。其中,TF-IDF作为相似度依据,MapReduce+HBase作为分布式框架。 集群配置 --- 4个节点:1个Master,3个Slave,均运行64位Centos系统 运行环境 --- Hadoop:2.7.3 Hbase:1.2.3 python 2.7.3 java 1.8.0 系统架构 --- 1. **分布式存储** 使用了HBase表存储图片信息
  3. 所属分类:图像处理

    • 发布日期:2018-06-25
    • 文件大小:473099
    • 提供者:oceandreami
  1. C++网络爬虫项目

  2. WEBCRAWLER 网络爬虫实训项目 1 WEBCRAWLER 网 络 爬 虫 实 训 项 目 文档版本: 1.0.0.1 编写单位: 达内IT培训集团 C++教学研发部 编写人员: 闵卫 定稿日期: 2015年11月20日 星期五WEBCRAWLER 网络爬虫实训项目 2 1. 项目概述 互联网产品形形色色,有产品导向的,有营销导向的,也有技术导向的,但是 以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中最具技 术含量的产品,如果不是唯一,至少也是其中之一。 经过十几年的发展
  3. 所属分类:C/C++

    • 发布日期:2018-07-04
    • 文件大小:4194304
    • 提供者:qq15690515
  1. mysql原理-海量存储

  2. 1. 数据库原理 关系代数 事务l sql k-v存储的使用 数据存储模型 数据写入模式性能和安全性分析 2. 倒排索引 3. 分布式kv系统 数据的切分 数据的管理和扩容 数据安全性 读写可用性
  3. 所属分类:MySQL

    • 发布日期:2018-07-06
    • 文件大小:1048576
    • 提供者:u010365604
« 1 2 3 4 5 6 7 89 10 11 12 13 14 »