搜索资源 - 学习使用：学习hadoop使用 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 学习使用：学习hadoop使用

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

hadoop搭建与eclipse开发环境设置
目的很简单，为进行研究与学习，部署一个hadoop运行环境，并搭建一个hadoop开发与测试环境。具体目标是： 1.在ubuntu系统上部署hadoop 2.在windows 上能够使用eclipse连接ubuntu系统上部署的hadoop进行开发与测试 3.只需要在eclipse中“Run on Hadoop"，不需要自己打包上传运行。
所属分类：Java
- 发布日期：2011-07-18
- 文件大小：452kb
- 提供者：rariki

hadoop-eclipse使用jar包
hadoop－eclipse的jar包我自己试过 hadoop：1.0.2 eclipse:4.* 好用分享给大家希望学习hadoop的mina可以用得着
所属分类：其它
- 发布日期：2012-08-16
- 文件大小：5mb
- 提供者：dalianwang74

基于hadoop用并行递归实现排列组合运算
数字排列组合是个经典的算法问题，它很通俗易懂，适合不懂业务的人学习，我们通过它来发现和运用并行计算的优势，可以得到一个很直观的体会，并留下深刻的印象。问题如下：请写一个程序，输入M，然后打印出M个数字的所有排列组合（每个数字为1，2，3，4中的一个）。比如：M=3，输出： 1，1，1 1，1，2 …… 4，4，4 共64个注意：这里是使用计算机遍历出所有排列组合，而不是求总数，如果只求总数，可以直接利用数学公式进行计算了。这种算法常用递归或迭代来实现，单当M=14时，中间结果数量已经过亿
所属分类：Java
- 发布日期：2013-01-06
- 文件大小：5kb
- 提供者：shufanshijie

hadoop-core-1.1.2.jar修改版
本包是为了解决在windows下通过cygwin运行hadoop时，执行tasktracker模块时报错Failed to set permissions of path: \mapred\local\ttprivate to 0700，通过修改源代码来解决的包。希望能该问题困扰的童鞋们，提供便利。注意：仅为了在windows下学习hadoop使用，不建议应用到生产环境。
所属分类：Java
- 发布日期：2013-07-20
- 文件大小：3mb
- 提供者：peter_wwhe

Hadoop 教程
教程内容第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍的起源于体系介绍 Hadoop adoop 学习目标学习目标：map/reducemap/reduce map/reducemap/reduce 编程，编程， pig pig，HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。的安装与使用等。的安装与使用等。 Hadoop ado
所属分类：其它
- 发布日期：2013-07-29
- 文件大小：336kb
- 提供者：liulangchina

妳那伊抹微笑_云计算之Hadoop-2.2.0+Hbaase-0.96.2 +Hive-0.13.1完全分布式环境整合安装文档V1.0.0.docx
资源描述：妳那伊抹微笑_云计算之Hadoop-2.2.0+Hbaase-0.96.2 +Hive-0.13.1完全分布式环境整合安装文档V1.0.0.docx 博客地址：http://blog.csdn.net/u012185296 技术方向：Flume+Kafka+Storm+Redis/Hbase+Hadoop+Hive+Mahout+Spark ... 云计算技术版权声明：整理不易，且学且珍惜，仅供学习交流使用，未经允许不得用于任何商业用途，谢谢合作 qq交流群：214293307 云
所属分类：Java
- 发布日期：2014-08-18
- 文件大小：518kb
- 提供者：u012185296

虾皮工作室文档 - Hadoop入门教程
该文档是虾皮老师（博客园）自己撰写的，觉得很好就分享给大家。这个对于入门学习Hadoop是非常有帮助的。里面的文字简单易懂。文档列表： 1）Hadoop集群_第1期_CentOS安装配置_V1.0 　　2）Hadoop集群_第2期_机器信息分布表_V1.1 　　3）Hadoop集群_第3期_VSFTP安装配置_V1.0 　　4）Hadoop集群_第4期_SecureCRT使用_V1.0 　　5）Hadoop集群_第5期_Hadoop安装配置_V1.1 　　6）Hadoop集群_第5期副刊_J
所属分类：其它
- 发布日期：2014-09-12
- 文件大小：11mb
- 提供者：shuizhongmose

Hadoop从业者为什么需要Spark？
Hadoop从业者为什么需要Spark？答案是Hadoop已死，Spark称霸。而Hadoop的死亡过程在2012年已经开始： 1，由于Hadoop自身架构的导致了在离线数据存储分析意外的一切领域都力不从心，理论已经证明MapReduce模型可以模拟一切分布式计算，但是效率成为其死穴，而Spark基于RDD的计算图可以轻松、完整地表达MapReduce模型，并且能极为容易的处理实时流计算、机器学习、图计算、误差查询等； 2,2012年以来Hadoop本身架构臃肿并未得到本质性的改善，很多修改
所属分类：虚拟化
- 发布日期：2014-09-22
- 文件大小：412kb
- 提供者：javaniceyou

hadoop on docker
Docker是目前非常火的开源轻量级的引擎技术，能在linux系统快速创建一个lxc容器来部署应用。目前docker项目还在快速迭代，用go语言开发，用来构建虚拟云服务PAAS非常有前途。docker相对于传统的虚拟机技术，没有guestos虚拟层，能高效率的使用机器资源。本人不了解go语言，对docker 也只是初步的学习了基本使用，因为想学习点hadoop东西，用实验室电脑配置太低，用虚拟机搭建hadoop集群太卡，所以用docker 尝试搭建一个3个节点的最简单的集群：1个nameno
所属分类：虚拟化
- 发布日期：2014-12-10
- 文件大小：1mb
- 提供者：lxzmtb

Hadoop技术内幕深入理解MapReduce架构设计与实现原理.pdf
Hadoop技术内幕：深入解析MapReduce架构设计与实现原理目录前言第一部分基础篇第1章阅读源代码前的准备 1.1 准备源代码学习环境 1.1.1 基础软件下载 1.1.2 如何准备Windows环境 1.1.3 如何准备Linux环境 1.2 获取Hadoop源代码 1.3 搭建Hadoop源代码阅读环境 1.3.1 创建Hadoop工程 1.3.2 Hadoop源代码阅读技巧 1.4 Hadoop源代码组织结构 1.5 Hadoop初体验 1.5.1 启动Hadoop 1
所属分类：Java
- 发布日期：2015-11-24
- 文件大小：46mb
- 提供者：yuan_xw

学习使用：学习hadoop使用
因为包比较大，所以放在文档里面。分别是SDK_linux和HADOOP，文档里面的地址如果不可以使用了，请私信我。
所属分类：Linux
- 发布日期：2020-04-10
- 文件大小：75byte
- 提供者：qq_41567921

Python连接Hadoop数据中遇到的各种坑(汇总)
最近准备使用Python+Hadoop+Pandas进行一些深度的分析与机器学习相关工作。（当然随着学习过程的进展，现在准备使用Python+Spark+Hadoop这样一套体系来搭建后续的工作环境），当然这是后话。但是这项工作首要条件就是将Python与Hadoop进行打通，本来认为很容易的一项工作，没有想到竟然遇到各种坑，花费了整整半天时间。后来也在网上看到大家在咨询相同的问题，但是真正解决这个问题的帖子又几乎没有，所以现在将Python连接Hadoop数据库过程中遇到的各种坑进行一个汇总
所属分类：其它
- 发布日期：2020-12-20
- 文件大小：78kb
- 提供者：weixin_38722317

2018--Hadoop-:存放代码资源，交流大数据开发技术。共同成长，一同进步-源码资源
语言： 2018 Hadoop兴趣学习小组这里可以讨论的不光是Hadoop相关的技术，还有理想的... 提交规则：每周（在课设结束之前吧〜）至少在这个github项目厂库上提交一个issue ，作为每周回顾总结，终止时间是每周周日，内容可以包含：本周学习到的东西，对于课程项目的进展与认识，新的想法等。（言简意赅，分点陈述）学习过程中遇到的问题。（附问题描述和截图或查找的相关博客）其他人可以评论相关问题，给予解答。学习过程中遇到的好的资源，可以放到这里。某些好的博客，算法讲解教程，视频
所属分类：其它
- 发布日期：2021-03-24
- 文件大小：105mb
- 提供者：weixin_42101720

Apache-pyspark-hadoop-using-databricks:说明使用pyspark执行的一些基本活动，并使用MLlib API执行一些机器学习（ML）算法-源码
Apache-pyspark-hadoop使用数据块说明使用pyspark执行的一些基本活动，并使用MLlib API执行一些机器学习（ML）算法发布在此存储库上的笔记本是使用databricks开发的，databricks是spark创始人创建的一个开源平台，您可以选择以下提到的其他平台： 1）在虚拟机/本地机上使用ubuntu（或） 2）AWS EC2（或） 3）AWS EMR（或） 4）数据砖。为了使用数据砖在此github存储库中执行笔记本，请创建一个社区版帐户，然后开始
所属分类：其它
- 发布日期：2021-03-07
- 文件大小：80kb
- 提供者：weixin_42131405

Hadoop新MapReduce框架Yarn详解
对于业界的大数据存储及分布式处理系统来说，Hadoop是耳熟能详的卓越开源分布式文件存储及处理框架，对于Hadoop框架的介绍在此不再累述，读者可参考Hadoop官方简介。使用和学习过老Hadoop框架（0.20.0及之前版本）的同仁应该很熟悉如下的原MapReduce框架图：图1.Hadoop原MapReduce架构从上图中可以清楚的看出原MapReduce程序的流程及设计思路：可以看得出原来的map-reduce架构是简单明了的，在最初推出的几年，也得到了众多的成功案例，获得业界广泛的支持和
所属分类：其它
- 发布日期：2021-03-04
- 文件大小：649kb
- 提供者：weixin_38622427

使用电信大数据进行城市规模的本地化
在电信（telco）行业中，使用测量报告（MR）数据准确定位城市规模的移动设备（MD）仍然具有挑战性，该数据可测量MD与电信网络中的基站（BS）连接时的无线电信号强度参数用于拨打/接听电话或移动宽带（MBB）服务。在本文中，我们发现，广泛使用的基于位置的服务（LBS）在电信网络中积累了大量的OTT（OTT）全球定位系统（GPS）数据，这些数据可以自动用作学习的训练标签基于MR的精确定位系统。得益于这些电信大数据，我们在基于Spark / Hadoop电信大数据平台中部署了上下文感知的粗略到精
所属分类：其它
- 发布日期：2021-03-02
- 文件大小：1mb
- 提供者：weixin_38625464

sifarish：在Hadoop和Storm上基于内容和基于协作过滤的推荐和个性化引擎实现-源码
介绍 Sifarish是一套用于在Hadoop和Storm上实现的推荐个性化解决方案。各种算法可用，包括基于特征相似性的推荐和使用社交评分数据的基于协作过滤的推荐哲学提供完整的业务解决方案，而不仅仅是一堆机器学习算法使用简单 CSV格式的输入输出在简单的JSON文件中定义的元数据带有大量配置旋钮，可高度配置入门请阅读../resource/GentleIntroductionToSifarish.docx以获取高级介绍和概述。资源目录中的各种教程文档对于运行不同的示例用例非常有
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：319kb
- 提供者：weixin_42097208

LearningSpark：学习使用Spark的Scala示例-源码
LearningSpark项目注意：此代码现在使用Spark 2.0.0及更高版本-如果您仍在使用Spark的早期版本，则可能需要关闭before_spark2.0.0分支。该项目包含Scala代码片段，用于说明各种Apache Spark概念。它旨在通过提供一个不涉及Unix，集群配置，从源代码构建或安装Hadoop超级简单的入口，帮助您开始学习Apache Spark（作为Scala程序员）。在使用了这些示例以达到基本的熟悉度之后，其中许多活动将在您的学习经历的后期变得必要。它
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：224kb
- 提供者：weixin_42169245

h2o-3：H2O是一个开源，分布式，快速且可扩展的机器学习平台：深度学习，梯度提升（GBM）和XGBoost，随机森林，广义线性建模（带有弹性网的GLM），K均值，PCA，广义附加模型（GAM），RuleFit，支持向量机（SVM），堆叠
水 H2O是用于分布式，可扩展的机器学习的内存平台。 H2O使用熟悉的界面（例如R，Python，Scala，Java，JSON和Flow笔记本/网络界面），并与Hadoop和Spark等大数据技术无缝协作。 H2O提供了许多流行实现，例如广义线性模型（GLM），梯度提升机（包括XGBoost），随机森林，深层神经网络，堆叠体，朴素贝叶斯，广义加性模型（GAM），考克斯比例危害，K-表示PCA，Word2Vec以及全自动机器学习算法（）。 H2O是可扩展的，因此开发人员可以添加自己选择的
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：88mb
- 提供者：weixin_42126668

比特币价值预测器：[不维护]使用时间序列分析和比特币上推文的情绪分析来预测比特币价格-源码
比特币价值预测器抽象：该项目试图通过识别社交媒体情绪与市场情绪之间的相关性来预测比特币的未来价值。我们将通过收集来自Twitter，Facebook和linkedin等社交媒体的用户供稿来实现这一目标。有了语料库后，我们将使用IBM Watson的自然语言理解API来映射它们的关联情绪。在将情感映射到我们的语料库时，我们尝试捕获粒度级别的类别，即欢乐，愤怒，幸福等。我们将这些类别用作ML / DL算法的特征向量。然后，我们比较不同算法的结果，并选择精度最高的算法。技术：编程语
所属分类：其它
- 发布日期：2021-01-30
- 文件大小：455kb
- 提供者：weixin_42127748

« 12 3 4 5 6 »