您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hadoop搭建与eclipse开发环境设置

  2. 目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 具体目标是: 1.在ubuntu系统上部署hadoop 2.在windows 上能够使用eclipse连接ubuntu系统上部署的hadoop进行开发与测试 3.只需要在eclipse中“Run on Hadoop",不需要自己打包上传运行。
  3. 所属分类:Java

    • 发布日期:2011-07-18
    • 文件大小:452kb
    • 提供者:rariki
  1. hadoop-eclipse使用jar包

  2. hadoop-eclipse的jar包 我自己试过 hadoop:1.0.2 eclipse:4.* 好用 分享给大家 希望学习hadoop的mina可以用得着
  3. 所属分类:其它

    • 发布日期:2012-08-16
    • 文件大小:5mb
    • 提供者:dalianwang74
  1. 基于hadoop用并行递归实现排列组合运算

  2. 数字排列组合是个经典的算法问题,它很通俗易懂,适合不懂业务的人学习,我们通过它来发现和运用并行计算的优势,可以得到一个很直观的体会,并留下深刻的印象。问题如下: 请写一个程序,输入M,然后打印出M个数字的所有排列组合(每个数字为1,2,3,4中的一个)。比如:M=3,输出: 1,1,1 1,1,2 …… 4,4,4 共64个 注意:这里是使用计算机遍历出所有排列组合,而不是求总数,如果只求总数,可以直接利用数学公式进行计算了。 这种算法常用递归或迭代来实现,单当M=14时,中间结果数量已经过亿
  3. 所属分类:Java

    • 发布日期:2013-01-06
    • 文件大小:5kb
    • 提供者:shufanshijie
  1. hadoop-core-1.1.2.jar修改版

  2. 本包是为了解决在windows下通过cygwin运行hadoop时,执行tasktracker模块时报错Failed to set permissions of path: \mapred\local\ttprivate to 0700,通过修改源代码来解决的包。希望能该问题困扰的童鞋们,提供便利。 注意:仅为了在windows下学习hadoop使用,不建议应用到生产环境。
  3. 所属分类:Java

    • 发布日期:2013-07-20
    • 文件大小:3mb
    • 提供者:peter_wwhe
  1. Hadoop 教程

  2. 教程内容 第一章 Hadoop HadoopHadoopHadoop的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 的起源于体系介绍 Hadoop adoop 学习目标 学习目标 :map/reducemap/reduce map/reducemap/reduce 编程, 编程, pig pig,HbaseHbase Hbase、HiveHiveHiveHive的安装与使用等。 的安装与使用等。 的安装与使用等。 Hadoop ado
  3. 所属分类:其它

    • 发布日期:2013-07-29
    • 文件大小:336kb
    • 提供者:liulangchina
  1. 妳那伊抹微笑_云计算之Hadoop-2.2.0+Hbaase-0.96.2 +Hive-0.13.1完全分布式环境整合安装文档V1.0.0.docx

  2. 资源描述:妳那伊抹微笑_云计算之Hadoop-2.2.0+Hbaase-0.96.2 +Hive-0.13.1完全分布式环境整合安装文档V1.0.0.docx 博客地址:http://blog.csdn.net/u012185296 技术方向:Flume+Kafka+Storm+Redis/Hbase+Hadoop+Hive+Mahout+Spark ... 云计算技术 版权声明:整理不易,且学且珍惜,仅供学习交流使用,未经允许不得用于任何商业用途,谢谢合作 qq交流群:214293307 云
  3. 所属分类:Java

    • 发布日期:2014-08-18
    • 文件大小:518kb
    • 提供者:u012185296
  1. 虾皮工作室文档 - Hadoop入门教程

  2. 该文档是虾皮老师(博客园)自己撰写的,觉得很好就分享给大家。这个对于入门学习Hadoop是非常有帮助的。里面的文字简单易懂。 文档列表: 1)Hadoop集群_第1期_CentOS安装配置_V1.0   2)Hadoop集群_第2期_机器信息分布表_V1.1   3)Hadoop集群_第3期_VSFTP安装配置_V1.0   4)Hadoop集群_第4期_SecureCRT使用_V1.0   5)Hadoop集群_第5期_Hadoop安装配置_V1.1   6)Hadoop集群_第5期副刊_J
  3. 所属分类:其它

    • 发布日期:2014-09-12
    • 文件大小:11mb
    • 提供者:shuizhongmose
  1. Hadoop从业者为什么需要Spark?

  2. Hadoop从业者为什么需要Spark?答案是Hadoop已死,Spark称霸。 而Hadoop的死亡过程在2012年已经开始: 1,由于Hadoop自身架构的导致了在离线数据存储分析意外的一切领域都力不从心,理论已经证明MapReduce模型可以模拟一切分布式计算,但是效率成为其死穴,而Spark基于RDD的计算图可以轻松、完整地表达MapReduce模型,并且能极为容易的处理实时流计算、机器学习、图计算、误差查询等; 2,2012年以来Hadoop本身架构臃肿并未得到本质性的改善,很多修改
  3. 所属分类:虚拟化

    • 发布日期:2014-09-22
    • 文件大小:412kb
    • 提供者:javaniceyou
  1. hadoop on docker

  2. Docker是目前非常火的开源轻量级的引擎技术,能在linux系统快速创建一个lxc容器来部署应用。目前docker项目还在快速迭代,用go语言开发,用来构建虚拟云服务PAAS非常有前途。docker相对于传统的虚拟机技术,没有guestos虚拟层,能高效率的使用机器资源 。本人不了解go语言,对docker 也只是初步的学习了基本使用,因为想学习点hadoop东西,用实验室电脑配置太低,用虚拟机搭建hadoop集群太卡,所以用docker 尝试搭建一个3个节点的最简单的集群:1个nameno
  3. 所属分类:虚拟化

    • 发布日期:2014-12-10
    • 文件大小:1mb
    • 提供者:lxzmtb
  1. Hadoop技术内幕 深入理解MapReduce架构设计与实现原理.pdf

  2. Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 目录 前言 第一部分 基础篇 第1章 阅读源代码前的准备 1.1 准备源代码学习环境 1.1.1 基础软件下载 1.1.2 如何准备Windows环境 1.1.3 如何准备Linux环境 1.2 获取Hadoop源代码 1.3 搭建Hadoop源代码阅读环境 1.3.1 创建Hadoop工程 1.3.2 Hadoop源代码阅读技巧 1.4 Hadoop源代码组织结构 1.5 Hadoop初体验 1.5.1 启动Hadoop 1
  3. 所属分类:Java

    • 发布日期:2015-11-24
    • 文件大小:46mb
    • 提供者:yuan_xw
  1. 学习使用:学习hadoop使用

  2. 因为包比较大,所以放在文档里面。分别是SDK_linux和HADOOP,文档里面的地址如果不可以使用了,请私信我。
  3. 所属分类:Linux

    • 发布日期:2020-04-10
    • 文件大小:75byte
    • 提供者:qq_41567921
  1. Python连接Hadoop数据中遇到的各种坑(汇总)

  2. 最近准备使用Python+Hadoop+Pandas进行一些深度的分析与机器学习相关工作。(当然随着学习过程的进展,现在准备使用Python+Spark+Hadoop这样一套体系来搭建后续的工作环境),当然这是后话。 但是这项工作首要条件就是将Python与Hadoop进行打通,本来认为很容易的一项工作,没有想到竟然遇到各种坑,花费了整整半天时间。后来也在网上看到大家在咨询相同的问题,但是真正解决这个问题的帖子又几乎没有,所以现在将Python连接Hadoop数据库过程中遇到的各种坑进行一个汇总
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:78kb
    • 提供者:weixin_38722317
  1. 2018--Hadoop-:存放代码资源,交流大数据开发技术。共同成长,一同进步-源码资源

  2. 语言 : 2018 Hadoop兴趣学习小组 这里可以讨论的不光是Hadoop相关的技术,还有理想的... 提交规则: 每周(在课设结束之前吧〜)至少在这个github项目厂库上提交一个issue ,作为每周回顾总结,终止时间是每周周日,内容可以包含: 本周学习到的东西,对于课程项目的进展与认识,新的想法等。(言简意赅,分点陈述) 学习过程中遇到的问题。(附问题描述和截图或查找的相关博客)其他人可以评论相关问题,给予解答。 学习过程中遇到的好的资源,可以放到这里。某些好的博客,算法讲解教程,视频
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:105mb
    • 提供者:weixin_42101720
  1. Apache-pyspark-hadoop-using-databricks:说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法-源码

  2. Apache-pyspark-hadoop使用数据块 说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法 发布在此存储库上的笔记本是使用databricks开发的,databricks是spark创始人创建的一个开源平台,您可以选择以下提到的其他平台: 1)在虚拟机/本地机上使用ubuntu(或) 2)AWS EC2(或) 3)AWS EMR(或) 4)数据砖。 为了使用数据砖在此github存储库中执行笔记本,请创建一个社区版帐户,然后开始
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:80kb
    • 提供者:weixin_42131405
  1. Hadoop新MapReduce框架Yarn详解

  2. 对于业界的大数据存储及分布式处理系统来说,Hadoop是耳熟能详的卓越开源分布式文件存储及处理框架,对于Hadoop框架的介绍在此不再累述,读者可参考Hadoop官方简介。使用和学习过老Hadoop框架(0.20.0及之前版本)的同仁应该很熟悉如下的原MapReduce框架图:图1.Hadoop原MapReduce架构从上图中可以清楚的看出原MapReduce程序的流程及设计思路:可以看得出原来的map-reduce架构是简单明了的,在最初推出的几年,也得到了众多的成功案例,获得业界广泛的支持和
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:649kb
    • 提供者:weixin_38622427
  1. 使用电信大数据进行城市规模的本地化

  2. 在电信(telco)行业中,使用测量报告(MR)数据准确定位城市规模的移动设备(MD)仍然具有挑战性,该数据可测量MD与电信网络中的基站(BS)连接时的无线电信号强度参数用于拨打/接听电话或移动宽带(MBB)服务。 在本文中,我们发现,广泛使用的基于位置的服务(LBS)在电信网络中积累了大量的OTT(OTT)全球定位系统(GPS)数据,这些数据可以自动用作学习的训练标签基于MR的精确定位系统。 得益于这些电信大数据,我们在基于Spark / Hadoop电信大数据平台中部署了上下文感知的粗略到精
  3. 所属分类:其它

  1. sifarish:在Hadoop和Storm上基于内容和基于协作过滤的推荐和个性化引擎实现-源码

  2. 介绍 Sifarish是一套用于在Hadoop和Storm上实现的推荐个性化解决方案。 各种算法可用,包括基于特征相似性的推荐和使用社交评分数据的基于协作过滤的推荐 哲学 提供完整的业务解决方案,而不仅仅是一堆机器学习算法 使用简单 CSV格式的输入输出 在简单的JSON文件中定义的元数据 带有大量配置旋钮,可高度配置 入门 请阅读../resource/GentleIntroductionToSifarish.docx以获取高级介绍和概述。 资源目录中的各种教程文档对于运行不同的示例用例非常有
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:319kb
    • 提供者:weixin_42097208
  1. LearningSpark:学习使用Spark的Scala示例-源码

  2. LearningSpark项目 注意:此代码现在使用Spark 2.0.0及更高版本-如果您仍在使用Spark的早期版本,则可能需要关闭before_spark2.0.0分支。 该项目包含Scala代码片段,用于说明各种Apache Spark概念。 它旨在通过提供一个不涉及Unix,集群配置,从源代码构建或安装Hadoop超级简单的入口,帮助您开始学习Apache Spark(作为Scala程序员)。 在使用了这些示例以达到基本的熟悉度之后,其中许多活动将在您的学习经历的后期变得必要。 它
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:224kb
    • 提供者:weixin_42169245
  1. h2o-3:H2O是一个开源,分布式,快速且可扩展的机器学习平台:深度学习,梯度提升(GBM)和XGBoost,随机森林,广义线性建模(带有弹性网的GLM),K均值,PCA,广义附加模型(GAM),RuleFit,支持向量机(SVM),堆叠

  2. 水 H2O是用于分布式,可扩展的机器学习的内存平台。 H2O使用熟悉的界面(例如R,Python,Scala,Java,JSON和Flow笔记本/网络界面),并与Hadoop和Spark等大数据技术无缝协作。 H2O提供了许多流行实现,例如广义线性模型(GLM),梯度提升机(包括XGBoost),随机森林,深层神经网络,堆叠体,朴素贝叶斯,广义加性模型(GAM),考克斯比例危害,K-表示PCA,Word2Vec以及全自动机器学习算法( )。 H2O是可扩展的,因此开发人员可以添加自己选择的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:88mb
    • 提供者:weixin_42126668
  1. 比特币价值预测器:[不维护]使用时间序列分析和比特币上推文的情绪分析来预测比特币价格-源码

  2. 比特币价值预测器 抽象: 该项目试图通过识别社交媒体情绪与市场情绪之间的相关性来预测比特币的未来价值。 我们将通过收集来自Twitter,Facebook和linkedin等社交媒体的用户供稿来实现这一目标。 有了语料库后,我们将使用IBM Watson的自然语言理解API来映射它们的关联情绪。 在将情感映射到我们的语料库时,我们尝试捕获粒度级别的类别,即欢乐,愤怒,幸福等。我们将这些类别用作ML / DL算法的特征向量。 然后,我们比较不同算法的结果,并选择精度最高的算法。 技术: 编程语
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:455kb
    • 提供者:weixin_42127748
« 12 3 4 5 6 »