您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大规模网页模块识别与信息提取系统设计与实现

  2. 本科生论文。本文在已有的基于Dom-Tree和启发式规则的网页信息提取算法的基础上,通过为所有符合W3C规范的Html标签分类,逐个分析各Html标签所包含的语义信息,细化规则设置,实现了一种自底向上的无信息遗漏的网页分块算法,并在此基础上,利用统计方法得到详细的概率分布数据,实现了文本相似度比较和Bayes后验概率估计两种网页主题内容信息块识别算法,并将其求交,提高了主题内容信息块的识别精确度。 上述算法已集成到天网搜索引擎平台的网页预处理模块中,并且在SEWM 2008会议中,以这套算法为
  3. 所属分类:其它

    • 发布日期:2009-11-30
    • 文件大小:1mb
    • 提供者:zjj77520
  1. hadoop map reduce 中文教程

  2. hadoop map reduce 的中文简易教程,能轻松帮助普通用户不需了解太多hadoop底层知识就能实现分布式编程,很好的入门教程。
  3. 所属分类:Java

    • 发布日期:2010-08-18
    • 文件大小:342kb
    • 提供者:hciform
  1. mapreeduce中文版本

  2. 比较详细的介绍了google系统中map reduce的使用原理,比较适合研究分布式计算的人
  3. 所属分类:数据库

    • 发布日期:2011-08-11
    • 文件大小:444kb
    • 提供者:yanlv1983
  1. Fourinone分布式计算框架

  2. FourInOne(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我也看了老外写的其他开源框架,也对分布式计算进行了长时间的思考,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为什么一切会那么复杂,我觉的自己可以写一个更简单的东西,它不需要过度设计
  3. 所属分类:互联网

    • 发布日期:2011-08-29
    • 文件大小:82kb
    • 提供者:fourinone
  1. GFS, map/reduce, bigtable等Google三大论文中文翻译版

  2. CSDN最好质量的翻译,加入作者的解释,让你读得懂
  3. 所属分类:数据库

    • 发布日期:2011-09-22
    • 文件大小:2mb
    • 提供者:rogergod
  1. Hadoop 中文文档,从简至深

  2. hadoop 中文,map/reduce, HDFS分布式文件系统
  3. 所属分类:Java

    • 发布日期:2012-01-17
    • 文件大小:2mb
    • 提供者:luoshan
  1. Fourinone分布式并行计算四合一框架

  2.   Fourinone(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为什么一切会那么复杂,我觉的自己可以写一个更简单的东西,它不需要过度设
  3. 所属分类:Web开发

    • 发布日期:2012-06-12
    • 文件大小:389kb
    • 提供者:wwwgg265net2
  1. fourinone-2.05.28

  2. 淘宝Fourinone(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为什么一切会那么复杂,我觉的自己可以写一个更简单的东西,它不需要过度设
  3. 所属分类:Java

    • 发布日期:2013-12-11
    • 文件大小:389kb
    • 提供者:dengai
  1. fourinone-3.04.25

  2. 淘宝Fourinone(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为什么一切会那么复杂,我觉的自己可以写一个更简单的东西,它不需要过度设
  3. 所属分类:Java

    • 发布日期:2013-12-11
    • 文件大小:396kb
    • 提供者:dengai
  1. Google+MapReduce中文版

  2. MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子, 本论文将详细描述这个模型。
  3. 所属分类:Java

    • 发布日期:2013-12-20
    • 文件大小:571kb
    • 提供者:ph123456789
  1. Hadoop入门中文手册

  2. Hadoop入门中文手册 目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等,同样也介绍了Hive,HBase详细安装应用! 目前国内应用和研究Hadoop的企业也越来越多,包括淘宝、百度、腾讯、网易、金山等。淘宝是国内最先使用Hadoop的公司之一;百度在Hadoop上进行广泛应用并对它进行改进和调整,同时赞助了HyperTable的开发。总之,互联网企业是Hadoop在
  3. 所属分类:Linux

    • 发布日期:2014-05-23
    • 文件大小:1mb
    • 提供者:machen_smiling
  1. 大规模网页模块识别与信息提取系统设计与实现

  2. 大规模网页模块识别与信息提取系统设计与实现,朱磊同学的毕业设计工作属于天网搜索引擎预处理模块,提出了一套基于语义 的网页分块和主题内容信息提取算法,并在SEWM2008中文Web信息检索评测项 中得到检验。在该套算法基础上,还实现了基于Map-Reduce的分布式QuarkRank 算法。
  3. 所属分类:讲义

    • 发布日期:2014-05-30
    • 文件大小:1mb
    • 提供者:a1370283038
  1. Map/Reduce:大规模集群上的简化数据处理

  2. Map/Reduce:大规模集群上的简化数据处理中文翻译,但也有一些语句翻译不到位,请谅解。希望能够对大家有帮助。
  3. 所属分类:互联网

    • 发布日期:2014-07-08
    • 文件大小:316kb
    • 提供者:w0855010107
  1. MapReduce中文翻译

  2. MapReduce中文翻译,MapReduce是一个编程模型、和处理,产生大数据集的相关实现。用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集。然后再指定一个reduce函数合并所有的具有相同中间key的中间value。下面将列举许多可以用这个模型来表示的实际工作。
  3. 所属分类:专业指导

    • 发布日期:2008-11-07
    • 文件大小:105kb
    • 提供者:sxf_824
  1. nutch入门学习中文文档

  2. Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 研究nutch的原因 可能有的朋友会有疑问,我们有google,有百度,为何还需要建立自己的搜索引擎呢?这里我列出3点原因: (1) 透明度:nutch是开放源代码的,因此任何人都可以查看他的排序算法是如何工作的。商业的搜索引擎排序算法都是保密的,我们无法知道为什么搜索出来的排序结果是如何算出来的。更进一步,一些搜索引擎允许竞价排名,比如百度,这样的索引结果并不是和站点内容相关的。因此 nutc
  3. 所属分类:其它

    • 发布日期:2008-11-12
    • 文件大小:1mb
    • 提供者:zdxcpp
  1. hadoop 中文手册

  2. hadoop 中文手册 Hadoop文档 下面的文档是一些概念介绍和操作教程,可帮助你开始使用Hadoop。如果遇到了问题,你可以向邮件列表求助或者浏览一下存档邮件。 Hadoop快速入门 Hadoop集群搭建 Hadoop分布式文件系统 Hadoop Map-Reduce教程 Hadoop本地库 API参考 维基 常见问题
  3. 所属分类:其它

    • 发布日期:2017-04-25
    • 文件大小:1mb
    • 提供者:yanzuoguang
  1. Hadoop入门中文手册

  2. Hadoop入门中文手册 目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等,同样也介绍了Hive,HBase详细安装应用! 目前国内应用和研究Hadoop的企业也越来越多,包括淘宝、百度、腾讯、网易、金山等。淘宝是国内最先使用Hadoop的公司之一;百度在Hadoop上进行广泛应用并对它进行改进和调整,同时赞助了HyperTable的开发。总之,互联网企业是Hadoop在
  3. 所属分类:网络基础

    • 发布日期:2017-06-22
    • 文件大小:1mb
    • 提供者:jiangsucsdn002
  1. 中文分词mapreduce程序

  2. 对中文进行分词的java代码,分别在map reduce中实现。
  3. 所属分类:Java

    • 发布日期:2018-03-07
    • 文件大小:1mb
    • 提供者:yerrow_dark