您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜易站内搜索引擎

  2. 搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等技术,可与数据库无缝集成,目前支持MS SQL 2000/2005,My SQL数据库。 软件基于B/S架构技术,前后端设计精美,操作体验佳。 软件特性: 1,智能中文分词:集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率; 2,多数据库支持:目
  3. 所属分类:C#

    • 发布日期:2013-05-25
    • 文件大小:1048576
    • 提供者:kwklover
  1. 简单Java搜索引擎实现——豆瓣主题搜索

  2. 这是信息检索课程的一个课后大作业,实现简单的搜索引擎功能,有多线程爬虫,中文分词,倒排索引,查询模型等内容。后台用Java实现,前台是一个简单的jsp界面。后粗糙,须建一个数据库,可从程序中Page类看出,就一张表,很简单。在运行前,需要先运行crawler类,保证从网页爬取数据,存在raws文件夹内。
  3. 所属分类:Java

    • 发布日期:2013-06-25
    • 文件大小:1048576
    • 提供者:jul324
  1. 搜易站内搜索引擎V1.2

  2. 搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等技术,可与数据库无缝集成,目前支持MS SQL 2000/2005,My SQL数据库。 软件基于B/S架构技术,前后端设计精美,操作体验佳。 软件特性: 1,智能中文分词:集成自主研发的面向站内搜索优化的细粒度中文分词充分兼顾搜准率和搜全率; 2,多数据库支持:目
  3. 所属分类:C#

    • 发布日期:2013-06-26
    • 文件大小:2097152
    • 提供者:kwklover
  1. mining the web

  2. web信息抓取 搜索算法 倒排索引 分类 聚类 数据挖掘
  3. 所属分类:Web开发

    • 发布日期:2008-09-16
    • 文件大小:3145728
    • 提供者:lijiecong
  1. Hadoop 教程

  2. 教程内容 第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 Hadoop adoop 学习目标 学习目标 :map/reducemap/reduce map/reducemap/reduce 编程, 编程, pig pig,HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。 的安装与使用等。 的安装与使用等。 Hadoop ado
  3. 所属分类:其它

    • 发布日期:2013-07-29
    • 文件大小:344064
    • 提供者:liulangchina
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. lucene原理分析

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点: (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。 (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。 (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。 (4)设计了独立于语言和文件格式的文本分析接口,索引器通
  3. 所属分类:其它

    • 发布日期:2013-11-29
    • 文件大小:4194304
    • 提供者:u010747123
  1. JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序

  2. java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。
  3. 所属分类:Java

    • 发布日期:2013-12-20
    • 文件大小:124928
    • 提供者:zhukova
  1. 空间向量模型

  2. 空间向量模型 信息检索作业 基于倒排索引
  3. 所属分类:C/C++

    • 发布日期:2014-04-02
    • 文件大小:6291456
    • 提供者:u011332819
  1. 大数据 海量数据 处理方法总结

  2. 大数据量,海量数据 处理方法总结 包括Bloom filter 哈希 bit-map 堆 双层桶划分 数据库索引 倒排索引 外排序 trie树等。细分为适用范围、要点、实例等。
  3. 所属分类:其它

    • 发布日期:2014-05-29
    • 文件大小:14336
    • 提供者:wuxxuan
  1. 信息检索复习范围

  2. 可以快速复习 10.描述LSI模型 11.实例分析VSM模型 12.信息检索系统常见的索引技术有哪些,各自的使用场合如何? 13.实例分析倒排索引 14.信息检索查询处理的基本过程 15.什么是相关度反馈 16.实例计算相关度反馈的查询重写 17.分析违反馈和隐反馈 18.查询扩展的方法有哪些 19.描述网络爬虫系统 20.网页预处理的过程有哪些 21.描述pagerank算法 22.描述hits算法 24.文本分类系统中,特征选择有哪些方法,优缺点方法如何?
  3. 所属分类:网络管理

    • 发布日期:2014-06-26
    • 文件大小:573
    • 提供者:zhaodouddou
  1. 海量数据处理

  2. 海量数据处理相关 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无 法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、 数据库、倒排索引、Trie 树)来解决;而对于空间问题,可以采取分而治之(哈希映射)的方法,也就是 说,把规模大的数据转化为规模小的,从而各个击破。 此外,针对常说的单机及集群问题,通俗来讲,单机就是指处理装载数据的机器有限(只要考虑 CPU、 内
  3. 所属分类:其它

    • 发布日期:2014-08-28
    • 文件大小:932864
    • 提供者:yangdedipan1234
  1. 面向美食网站的搜索及点评与图片去重模块的设计与实现

  2. 本课题所研究的内容是某美食类网站关于图片,内容的处理以及垂直搜索 的问题。对于图片处理,简单来说是图片的匹配,采用匹配算法过滤出重复的 图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图 片信息,使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计 算图片的相似度数据来实现。内容处理问题即点评处理,该问题与图片处理类 似,通过中文分词算法对点评内容进行分词,然后根据规则对待匹配的内容进 行排序,最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进 行专项搜索,
  3. 所属分类:PHP

  1. 搜索引擎概述

  2. 搜索引擎相关技术概述,学习搜索引擎的基础,现有搜索引擎分析、倒排索引、相关性分析等
  3. 所属分类:C++

    • 发布日期:2014-12-08
    • 文件大小:261120
    • 提供者:sinat_23003095
  1. 这就是搜索引擎

  2. 介绍搜索引擎 入门书籍,介绍了倒排索引,如何建索引,如何检索。已经如何爬取网站
  3. 所属分类:C

    • 发布日期:2014-12-25
    • 文件大小:2097152
    • 提供者:qq_24454211
  1. 算法文档,来看看吧

  2. [原网页] [置顶] 程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大系列集锦 [原网页] 程序员编程艺术第三十~三十一章:字符串转换成整数,通配符字符串匹配 [原网页] 程序员编程艺术第二十八~二十九章:最大连续乘积子串、字符串编辑距离 [原网页] 数据挖掘中所需的概率论与数理统计知识、上 [原网页] 从K近邻算法、距离度量谈到KD树、SIFT+BBF算法 [原网页] 九月十月百度人搜,阿里巴巴,腾讯华为笔试面试八十题(第331-410题) [原网页] 支持向量机通俗导论(理解SVM的三
  3. 所属分类:讲义

    • 发布日期:2015-01-13
    • 文件大小:38797312
    • 提供者:u010811257
  1. Hadoop应用开发实战详解源代码

  2. Hadoop应用开发实战详解源代码  第4章 初识MapReduce   4.1 MapReduce简介     4.1.1 MapReduce要解决什么问题     4.1.2 MapReduce的理论基础     4.1.3 MapReduce的编程模式    4.2 MapReduce的集群行为    4.3 Map/Reduce框架    4.4 样例分析:单词计数     4.4.1 WordCount实例的运行过程     4.4.2 WordCount的源码分析和程序处理过程 
  3. 所属分类:Java

    • 发布日期:2015-05-25
    • 文件大小:202752
    • 提供者:syilo
  1. 十五个经典算法研究与总结

  2. 一、A*搜索算法 一(续)、A*,Dijkstra,BFS 算法性能比较及 A*算法的应用 二、Dijkstra 算法初探 二(续)、彻底理解 Dijkstra 算法 二(再续)、Dijkstra 算法+fibonacci 堆的逐步 c 实现 二(三续)、Dijkstra 算法+Heap 堆的完整 c 实现源码 三、动态规划算法 四、BFS 和 DFS 优先搜索算法 五、教你透彻了解红黑树 (红黑数系列六篇文章之其中两篇) 五(续)、红黑树算法的实现与剖析 六、教你初步了解 KMP 算法、up
  3. 所属分类:专业指导

    • 发布日期:2015-10-21
    • 文件大小:14680064
    • 提供者:yangengzhe
  1. 传智黑马赵星老师hadoop七天课程资料笔记-第四天(全)

  2. 传智黑马赵星老师hadoop七天课程资料笔记-第四天(全)
  3. 所属分类:Web开发

    • 发布日期:2015-10-27
    • 文件大小:38797312
    • 提供者:celestialtao
  1. 51CTO下载-lucene-highlighter-3.0.1.jar

  2. 建立倒排索引的重要核心代码,介绍代码中的核心思想并且附上了流程图,通过解释和图形展示更好了解
  3. 所属分类:Java

    • 发布日期:2015-11-04
    • 文件大小:47104
    • 提供者:crystalstart
« 1 2 3 4 5 6 78 9 10 11 12 13 14 »