您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于lucene和nutch的开源搜索引擎资料集合

  2. 其中内容均为前段时间研究开源搜索引擎时搜集参考的资料,非常齐全包含的内容有: Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索引擎.doc Linux下Nutch分布式配置和使用.pdf Lucene+Nutch源码.rar Lucene学习笔记.doc nutch_tutorial.pdf nutch二次开发总结.txt nutch入
  3. 所属分类:Java

    • 发布日期:2011-01-19
    • 文件大小:5mb
    • 提供者:greatman4551
  1. 自己动手写网络爬虫(全).pdf

  2. 《自己动手写网络爬虫》介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。《自己动手写网络爬虫》在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。   《自己动手写网络爬虫》此书代码清晰,但是对初学者不太合适,因为完全没有介绍开发平台和配置环境,以及在程序中所用到的jar包,初学者的动手能力有限,使得程序很难调通,高手倒是可以挑战一下 第1章 全面剖析网络爬虫 3   1.1 抓取网页   1.1.1
  3. 所属分类:专业指导

    • 发布日期:2011-12-17
    • 文件大小:2mb
    • 提供者:usenamer
  1. 自己动手写网络爬虫 完整版

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-02-25
    • 文件大小:25mb
    • 提供者:apxar
  1. 自己动手写网络爬虫 PDF

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-07-12
    • 文件大小:25mb
    • 提供者:xianchen1122
  1. 自己动手写网络爬虫_完整版

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-09-09
    • 文件大小:25mb
    • 提供者:haobaoipv6
  1. 自己动手写网络爬虫

  2. 完整版《自己动手写网络爬虫》! 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2
  3. 所属分类:专业指导

    • 发布日期:2013-10-27
    • 文件大小:27mb
    • 提供者:qq674708957
  1. PageRank介绍

  2. pagerank原理介绍,例子讲述,逐步加深,有深度有广度。易于理解,适合新手。
  3. 所属分类:Web开发

    • 发布日期:2014-07-22
    • 文件大小:199kb
    • 提供者:yutuotuo
  1. 自己动手写网络爬虫

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2015-12-25
    • 文件大小:25mb
    • 提供者:mr_boot
  1. 自己动手写网络爬虫

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2016-03-05
    • 文件大小:25mb
    • 提供者:cszhouyang
  1. Java编写多个爬虫实例

  2. Java爬虫实例类说明如下: DownLoadFile 文件下载 HtmlParserTool Html解析 MyCrawler 爬虫 ConsistentHash 一致性Hash WordCount Map-Reduce算法例子 Retrive 文件下载 IP 获得IP地址示例 ip QQ纯真数据库示例 HtmlParser 网页内容提取库HtmlParser的源码项目 nekohtml-1.9.7 nekohtml的源码项目 RhinoTest 测试js解析 ExtractContext
  3. 所属分类:Java

    • 发布日期:2018-08-29
    • 文件大小:86mb
    • 提供者:weixin_42404454
  1. pageRank-详细解析(具体例子).docx

  2. 详细介绍了PageRank算法 PageRank算法优缺点 优点: 是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。 缺点: 1)人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低 2)旧的页面等级会比新页面高。因为即使是非常好的新页面也不会有很多上游链接,除非它是某个站点的子站点。
  3. 所属分类:Web服务器

    • 发布日期:2020-06-27
    • 文件大小:282kb
    • 提供者:joey_ro
  1. google搜索引擎pagerank算法ppt

  2. pagerank算法ppt,上课专用,包括起源,算法介绍,举例子,作弊与反作弊,代码展示等等
  3. 所属分类:互联网

    • 发布日期:2021-03-31
    • 文件大小:1mb
    • 提供者:qq_42479987
  1. PageRank-Currently-Building--源码

  2. PaeRank-当前正在构建- 稀疏矩阵的高效线性复杂度读取 基于xG = alpha * x * P + [(1-alpha)(1 / N)+ alpha *(1 / N)(x * f ^ t)] e的Google网页排名计算 alpha =初始标量,N =顶点数,f ^ t =悬空节点指定向量,e = 1列向量 汇编 使用Makefile类型 制作 ./pagerank [“文件名”] [“收敛的精度”] [alpha] 一个例子可以用 奔跑 图形 一个文件夹,其中包含网页图形示例的文本文
  3. 所属分类:其它