搜索资源 - 中文，map/reduce - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 中文，map/reduce

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

大规模网页模块识别与信息提取系统设计与实现
本科生论文。本文在已有的基于Dom-Tree和启发式规则的网页信息提取算法的基础上，通过为所有符合W3C规范的Html标签分类，逐个分析各Html标签所包含的语义信息，细化规则设置，实现了一种自底向上的无信息遗漏的网页分块算法，并在此基础上，利用统计方法得到详细的概率分布数据，实现了文本相似度比较和Bayes后验概率估计两种网页主题内容信息块识别算法，并将其求交，提高了主题内容信息块的识别精确度。上述算法已集成到天网搜索引擎平台的网页预处理模块中，并且在SEWM 2008会议中，以这套算法为
所属分类：其它
- 发布日期：2009-11-30
- 文件大小：1mb
- 提供者：zjj77520

hadoop map reduce 中文教程
hadoop map reduce 的中文简易教程，能轻松帮助普通用户不需了解太多hadoop底层知识就能实现分布式编程，很好的入门教程。
所属分类：Java
- 发布日期：2010-08-18
- 文件大小：342kb
- 提供者：hciform

mapreeduce中文版本
比较详细的介绍了google系统中map reduce的使用原理，比较适合研究分布式计算的人
所属分类：数据库
- 发布日期：2011-08-11
- 文件大小：444kb
- 提供者：yanlv1983

Fourinone分布式计算框架
FourInOne（中文名字“四不像”）是一个四合一分布式计算框架，在写这个框架之前，我也看了老外写的其他开源框架，也对分布式计算进行了长时间的思考，当我们把复杂的hadoop当作一门学科学习时，似乎忘记了我们想解决问题的初衷：我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算，把更多的cpu和内存利用上，来解决我们数量大和计算复杂的问题，当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷，为什么一切会那么复杂，我觉的自己可以写一个更简单的东西，它不需要过度设计
所属分类：互联网
- 发布日期：2011-08-29
- 文件大小：82kb
- 提供者：fourinone

GFS, map/reduce, bigtable等Google三大论文中文翻译版
CSDN最好质量的翻译，加入作者的解释，让你读得懂
所属分类：数据库
- 发布日期：2011-09-22
- 文件大小：2mb
- 提供者：rogergod

Hadoop 中文文档，从简至深
hadoop 中文，map/reduce, HDFS分布式文件系统
所属分类：Java
- 发布日期：2012-01-17
- 文件大小：2mb
- 提供者：luoshan

Fourinone分布式并行计算四合一框架
　　Fourinone(中文名字“四不像”)是一个四合一分布式计算框架，在写这个框架之前，我对分布式计算进行了长时间的思考，也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时，似乎忘记了我们想解决问题的初衷：我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算，把更多的cpu和内存利用上，来解决我们数量大和计算复杂的问题，当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷，为什么一切会那么复杂，我觉的自己可以写一个更简单的东西，它不需要过度设
所属分类：Web开发
- 发布日期：2012-06-12
- 文件大小：389kb
- 提供者：wwwgg265net2

fourinone-2.05.28
淘宝Fourinone（中文名字“四不像”）是一个四合一分布式计算框架，在写这个框架之前，我对分布式计算进行了长时间的思考，也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时，似乎忘记了我们想解决问题的初衷：我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算，把更多的cpu和内存利用上，来解决我们数量大和计算复杂的问题，当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷，为什么一切会那么复杂，我觉的自己可以写一个更简单的东西，它不需要过度设
所属分类：Java
- 发布日期：2013-12-11
- 文件大小：389kb
- 提供者：dengai

fourinone-3.04.25
淘宝Fourinone（中文名字“四不像”）是一个四合一分布式计算框架，在写这个框架之前，我对分布式计算进行了长时间的思考，也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时，似乎忘记了我们想解决问题的初衷：我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算，把更多的cpu和内存利用上，来解决我们数量大和计算复杂的问题，当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷，为什么一切会那么复杂，我觉的自己可以写一个更简单的东西，它不需要过度设
所属分类：Java
- 发布日期：2013-12-11
- 文件大小：396kb
- 提供者：dengai

Google+MapReduce中文版
MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。
所属分类：Java
- 发布日期：2013-12-20
- 文件大小：571kb
- 提供者：ph123456789

Hadoop入门中文手册
Hadoop入门中文手册目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会，比如在HDFS上运行示例程序或简单作业等，同样也介绍了Hive，HBase详细安装应用！目前国内应用和研究Hadoop的企业也越来越多，包括淘宝、百度、腾讯、网易、金山等。淘宝是国内最先使用Hadoop的公司之一；百度在Hadoop上进行广泛应用并对它进行改进和调整，同时赞助了HyperTable的开发。总之，互联网企业是Hadoop在
所属分类：Linux
- 发布日期：2014-05-23
- 文件大小：1mb
- 提供者：machen_smiling

大规模网页模块识别与信息提取系统设计与实现
大规模网页模块识别与信息提取系统设计与实现,朱磊同学的毕业设计工作属于天网搜索引擎预处理模块，提出了一套基于语义的网页分块和主题内容信息提取算法，并在SEWM2008中文Web信息检索评测项中得到检验。在该套算法基础上，还实现了基于Map-Reduce的分布式QuarkRank 算法。
所属分类：讲义
- 发布日期：2014-05-30
- 文件大小：1mb
- 提供者：a1370283038

Map/Reduce：大规模集群上的简化数据处理
Map/Reduce：大规模集群上的简化数据处理中文翻译，但也有一些语句翻译不到位，请谅解。希望能够对大家有帮助。
所属分类：互联网
- 发布日期：2014-07-08
- 文件大小：316kb
- 提供者：w0855010107

MapReduce中文翻译
MapReduce中文翻译，MapReduce是一个编程模型、和处理，产生大数据集的相关实现。用户指定一个map函数处理一个key/value对，从而产生中间的key/value对集。然后再指定一个reduce函数合并所有的具有相同中间key的中间value。下面将列举许多可以用这个模型来表示的实际工作。
所属分类：专业指导
- 发布日期：2008-11-07
- 文件大小：105kb
- 提供者：sxf_824

nutch入门学习中文文档
Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。研究nutch的原因可能有的朋友会有疑问,我们有google,有百度,为何还需要建立自己的搜索引擎呢？这里我列出3点原因： (1) 透明度：nutch是开放源代码的，因此任何人都可以查看他的排序算法是如何工作的。商业的搜索引擎排序算法都是保密的，我们无法知道为什么搜索出来的排序结果是如何算出来的。更进一步，一些搜索引擎允许竞价排名，比如百度，这样的索引结果并不是和站点内容相关的。因此 nutc
所属分类：其它
- 发布日期：2008-11-12
- 文件大小：1mb
- 提供者：zdxcpp

hadoop 中文手册
hadoop 中文手册 Hadoop文档下面的文档是一些概念介绍和操作教程，可帮助你开始使用Hadoop。如果遇到了问题，你可以向邮件列表求助或者浏览一下存档邮件。 Hadoop快速入门 Hadoop集群搭建 Hadoop分布式文件系统 Hadoop Map-Reduce教程 Hadoop本地库 API参考维基常见问题
所属分类：其它
- 发布日期：2017-04-25
- 文件大小：1mb
- 提供者：yanzuoguang

Hadoop入门中文手册
Hadoop入门中文手册目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会，比如在HDFS上运行示例程序或简单作业等，同样也介绍了Hive，HBase详细安装应用！目前国内应用和研究Hadoop的企业也越来越多，包括淘宝、百度、腾讯、网易、金山等。淘宝是国内最先使用Hadoop的公司之一；百度在Hadoop上进行广泛应用并对它进行改进和调整，同时赞助了HyperTable的开发。总之，互联网企业是Hadoop在
所属分类：网络基础
- 发布日期：2017-06-22
- 文件大小：1mb
- 提供者：jiangsucsdn002

中文分词mapreduce程序
对中文进行分词的java代码，分别在map reduce中实现。
所属分类：Java
- 发布日期：2018-03-07
- 文件大小：1mb
- 提供者：yerrow_dark