您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Nutch公开课从搜索引擎到网络爬虫

  2. 课程背景:Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,最大的区别在于2.X对底层的数据存储进行了抽象以支持各种底层存储技术。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理的事实上的标准。Tika使用多种现有的开
  3. 所属分类:Java

    • 发布日期:2013-09-24
    • 文件大小:2mb
    • 提供者:yangshangchuan
  1. springmvc+maven+gora资料总结

  2. 最近学习了一个apache.gora框架,发现确实很方便,网上的相关资料太少了,只能硬着头皮看官网文档,在这里做出总结,希望可以帮到各位同仁
  3. 所属分类:Java

    • 发布日期:2013-12-26
    • 文件大小:149kb
    • 提供者:zysj2012
  1. Nutch:从搜索引擎到网络爬虫

  2. Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理的事实上的标准。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:19mb
    • 提供者:fat1
  1. nutch ,爬虫

  2. Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。 Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,这两大分支最大的区别在于2.X对底层的数据存储进行
  3. 所属分类:硬件开发

    • 发布日期:2016-09-21
    • 文件大小:1mb
    • 提供者:liuxuuebin
  1. Apache Nutch v1.15

  2. Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。 Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,这两大分支最大的区别在于2.X对底层的数据存储进行了抽象以支持各种底层存储技术。 在Nutch的进化过程中,产生了Hadoop、Tika、Gora和Crawler Comm
  3. 所属分类:Java

    • 发布日期:2018-08-14
    • 文件大小:7mb
    • 提供者:qq_37847802
  1. Nutch相关框架视频教程 讲义 杨尚川

  2. 1、 通过nutch,诞生了hadoop、tika、gora。 2、 nutch通过ivy来进行依赖管理(1.2之后)。 3、 nutch是使用svn进行源代码管理的。 4、 lucene、nutch、hadoop,在搜索界相当有名。 5、 ant构建之后,生成runtime文件夹,该文件夹下面有deploy和local文件夹,分别代表了nutch的两种运行方式。 6、 nutch和hadoop是通过什么连接起来的?通过nutch脚本。通过hadoop命令把apache-nutch-1.6.j
  3. 所属分类:算法与数据结构

    • 发布日期:2018-10-24
    • 文件大小:76kb
    • 提供者:panpanxuhebei
  1. gora:Apache Gora的镜像-源码

  2. Apache Gora项目 Apache Gora开源框架提供了内存数据模型和大数据持久性。 Gora支持持久存储到列存储,键值存储,文档存储和RDBMS,并通过广泛的Apache Hadoop MapReduce,Apache Spark,Apache Flink和Apache Pig支持来分析数据。 为什么选择强罗? 尽管对于关系数据库有各种出色的ORM框架,但是NoSQL数据存储区中的数据建模与它们的关系表兄弟有很大的不同。 而且,诸如JDO之类的数据模型不可知框架不足以用于用例,在这
  3. 所属分类:其它