搜索资源 - 倒排索引 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 倒排索引

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

搜易站内搜索引擎
搜易站内搜索引擎（SearchEasy Site Search Engine）是面向互联网网站的站内搜索解决方案，其针对网站使用数据库搜索性能差，体验差等问题，将搜索引擎技术应用于站内搜索；本系统具备中文分词，智能摘要，关键词高亮等技术，可与数据库无缝集成，目前支持MS SQL 2000/2005，My SQL数据库。软件基于B/S架构技术，前后端设计精美，操作体验佳。软件特性： 1，智能中文分词：集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率； 2，多数据库支持：目
所属分类：C#
- 发布日期：2013-05-25
- 文件大小：1048576
- 提供者：kwklover

简单Java搜索引擎实现——豆瓣主题搜索
这是信息检索课程的一个课后大作业，实现简单的搜索引擎功能，有多线程爬虫，中文分词，倒排索引，查询模型等内容。后台用Java实现，前台是一个简单的jsp界面。后粗糙，须建一个数据库，可从程序中Page类看出，就一张表，很简单。在运行前，需要先运行crawler类，保证从网页爬取数据，存在raws文件夹内。
所属分类：Java
- 发布日期：2013-06-25
- 文件大小：1048576
- 提供者：jul324

搜易站内搜索引擎V1.2
搜易站内搜索引擎（SearchEasy Site Search Engine）是面向互联网网站的站内搜索解决方案，其针对网站使用数据库搜索性能差，体验差等问题，将搜索引擎技术应用于站内搜索；本系统具备中文分词，智能摘要，关键词高亮等技术，可与数据库无缝集成，目前支持MS SQL 2000/2005，My SQL数据库。软件基于B/S架构技术，前后端设计精美，操作体验佳。软件特性： 1，智能中文分词：集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率； 2，多数据库支持：目
所属分类：C#
- 发布日期：2013-06-26
- 文件大小：2097152
- 提供者：kwklover

mining the web
web信息抓取搜索算法倒排索引分类聚类数据挖掘
所属分类：Web开发
- 发布日期：2008-09-16
- 文件大小：3145728
- 提供者：lijiecong

Hadoop 教程
教程内容第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍 Hadoop adoop 学习目标学习目标：map/reducemap/reduce map/reducemap/reduce 编程，编程， pig pig，HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。的安装与使用等。的安装与使用等。 Hadoop ado
所属分类：其它
- 发布日期：2013-07-29
- 文件大小：344064
- 提供者：liulangchina

实战Hadoop：开启通向云计算的捷径
第1章神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发参考文献第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
所属分类：其它
- 发布日期：2013-07-31
- 文件大小：61865984
- 提供者：jsntghf

lucene原理分析
Lucene作为一个全文检索引擎，其具有如下突出的优点：（1）索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。（2）在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。（3）优秀的面向对象的系统架构，使得对于Lucene扩展的学习难度降低，方便扩充新功能。（4）设计了独立于语言和文件格式的文本分析接口，索引器通
所属分类：其它
- 发布日期：2013-11-29
- 文件大小：4194304
- 提供者：u010747123

JAVA版本，每秒约10万汉字，基于词典的中文纯文本分词程序
java版本基于词典匹配，速度为每秒约10万个汉字，本人测试。同时生成倒排索引，倒排索引包含了对于分词的相关信息，如词频。若有Bug可与我联系。
所属分类：Java
- 发布日期：2013-12-20
- 文件大小：124928
- 提供者：zhukova

空间向量模型
空间向量模型信息检索作业基于倒排索引
所属分类：C/C++
- 发布日期：2014-04-02
- 文件大小：6291456
- 提供者：u011332819

大数据海量数据处理方法总结
大数据量，海量数据处理方法总结包括Bloom filter 哈希 bit-map 堆双层桶划分数据库索引倒排索引外排序 trie树等。细分为适用范围、要点、实例等。
所属分类：其它
- 发布日期：2014-05-29
- 文件大小：14336
- 提供者：wuxxuan

信息检索复习范围
可以快速复习 10.描述LSI模型 11.实例分析VSM模型 12.信息检索系统常见的索引技术有哪些，各自的使用场合如何？ 13.实例分析倒排索引 14.信息检索查询处理的基本过程 15.什么是相关度反馈 16.实例计算相关度反馈的查询重写 17.分析违反馈和隐反馈 18.查询扩展的方法有哪些 19.描述网络爬虫系统 20.网页预处理的过程有哪些 21.描述pagerank算法 22.描述hits算法 24.文本分类系统中，特征选择有哪些方法，优缺点方法如何？
所属分类：网络管理
- 发布日期：2014-06-26
- 文件大小：573
- 提供者：zhaodouddou

海量数据处理
海量数据处理相关所谓海量数据处理，是指基于海量数据的存储、处理、和操作。正因为数据量太大，所以导致要么无法在较短时间内迅速解决，要么无法一次性装入内存。事实上，针对时间问题，可以采用巧妙的算法搭配合适的数据结构（如布隆过滤器、哈希、位图、堆、数据库、倒排索引、Trie 树）来解决；而对于空间问题，可以采取分而治之（哈希映射）的方法，也就是说，把规模大的数据转化为规模小的，从而各个击破。此外，针对常说的单机及集群问题，通俗来讲，单机就是指处理装载数据的机器有限（只要考虑 CPU、内
所属分类：其它
- 发布日期：2014-08-28
- 文件大小：932864
- 提供者：yangdedipan1234

面向美食网站的搜索及点评与图片去重模块的设计与实现
本课题所研究的内容是某美食类网站关于图片，内容的处理以及垂直搜索的问题。对于图片处理，简单来说是图片的匹配，采用匹配算法过滤出重复的图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图片信息，使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计算图片的相似度数据来实现。内容处理问题即点评处理，该问题与图片处理类似，通过中文分词算法对点评内容进行分词，然后根据规则对待匹配的内容进行排序，最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进行专项搜索，
所属分类：PHP
- 发布日期：2014-09-14
- 文件大小：1048576
- 提供者：zhoutao1993allen

搜索引擎概述
搜索引擎相关技术概述,学习搜索引擎的基础,现有搜索引擎分析、倒排索引、相关性分析等
所属分类：C++
- 发布日期：2014-12-08
- 文件大小：261120
- 提供者：sinat_23003095

这就是搜索引擎
介绍搜索引擎入门书籍，介绍了倒排索引，如何建索引，如何检索。已经如何爬取网站
所属分类：C
- 发布日期：2014-12-25
- 文件大小：2097152
- 提供者：qq_24454211

算法文档,来看看吧
[原网页] [置顶] 程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大系列集锦 [原网页] 程序员编程艺术第三十~三十一章：字符串转换成整数，通配符字符串匹配 [原网页] 程序员编程艺术第二十八~二十九章：最大连续乘积子串、字符串编辑距离 [原网页] 数据挖掘中所需的概率论与数理统计知识、上 [原网页] 从K近邻算法、距离度量谈到KD树、SIFT+BBF算法 [原网页] 九月十月百度人搜，阿里巴巴，腾讯华为笔试面试八十题(第331-410题) [原网页] 支持向量机通俗导论（理解SVM的三
所属分类：讲义
- 发布日期：2015-01-13
- 文件大小：38797312
- 提供者：u010811257

Hadoop应用开发实战详解源代码
Hadoop应用开发实战详解源代码　第4章　初识MapReduce 　　4.1　MapReduce简介　　　　4.1.1　MapReduce要解决什么问题　　　　4.1.2　MapReduce的理论基础　　　　4.1.3　MapReduce的编程模式　　　4.2　MapReduce的集群行为　　　4.3　Map/Reduce框架　　　4.4　样例分析：单词计数　　　　4.4.1　WordCount实例的运行过程　　　　4.4.2　WordCount的源码分析和程序处理过程　
所属分类：Java
- 发布日期：2015-05-25
- 文件大小：202752
- 提供者：syilo

十五个经典算法研究与总结
一、A*搜索算法一(续)、A*,Dijkstra,BFS 算法性能比较及 A*算法的应用二、Dijkstra 算法初探二(续)、彻底理解 Dijkstra 算法二(再续)、Dijkstra 算法+fibonacci 堆的逐步 c 实现二(三续)、Dijkstra 算法+Heap 堆的完整 c 实现源码三、动态规划算法四、BFS 和 DFS 优先搜索算法五、教你透彻了解红黑树 (红黑数系列六篇文章之其中两篇) 五(续)、红黑树算法的实现与剖析六、教你初步了解 KMP 算法、up
所属分类：专业指导
- 发布日期：2015-10-21
- 文件大小：14680064
- 提供者：yangengzhe

传智黑马赵星老师hadoop七天课程资料笔记-第四天(全)
传智黑马赵星老师hadoop七天课程资料笔记-第四天(全)
所属分类：Web开发
- 发布日期：2015-10-27
- 文件大小：38797312
- 提供者：celestialtao

51CTO下载-lucene-highlighter-3.0.1.jar
建立倒排索引的重要核心代码，介绍代码中的核心思想并且附上了流程图，通过解释和图形展示更好了解
所属分类：Java
- 发布日期：2015-11-04
- 文件大小：47104
- 提供者：crystalstart

« 1 2 3 4 5 6 78 9 10 11 12 13 14 »