您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Mining of Massive Datasets

  2. 本书讲的是大规模数据挖掘,介绍了一些比较热门的话题,包括大规模文件系统,MapReduce框架,数据流挖掘,网络广告,推荐系统以及社交网络分析
  3. 所属分类:数据库

    • 发布日期:2011-10-23
    • 文件大小:2mb
    • 提供者:mzfor2004
  1. mapreduce_tools

  2. 在 Eclipse 环境下可以方便地进行 Hadoop 并行程序的开发和调试。推荐使用 IBM MapReduce Tools for Eclipse, 使用这个 Eclipse plugin 可以简化开发和部署 Hadoop 并行程序的过程。基于这个 plugin, 可以在 Eclipse 中创建一个 Hadoop MapReduce 应用程序,并且提供了一些基于 MapReduce 框架的类开发的向导,可以打包成 JAR 文件,部署一个 Hadoop MapReduce 应用程序到一个 H
  3. 所属分类:Java

    • 发布日期:2012-07-16
    • 文件大小:324kb
    • 提供者:xietaonju
  1. Google_MapReduce中文版-系统架构

  2. MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建 一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然 后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足 上述处理模型的例子,本论文将详细描述这个模型。 MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关 心:如何分割输入数据,在大量
  3. 所属分类:其它

    • 发布日期:2013-04-29
    • 文件大小:677kb
    • 提供者:yg359547115
  1. 基于ItemCF协同过滤、hadoop-mapreduce的商品推荐系统下载地址

  2. 基于ItemCF协同过滤、hadoop-mapreduce的商品推荐系统下载地址。 基于ItemCF的协同过滤 物品推荐系统 Collaborative filtering goods recommendation system based on ItemCF Step1.run(config, paths); // 格式化 去重 Format reset Step2.run(config, paths); // 计算得分矩阵 Score matrix Step3.run(config, pa
  3. 所属分类:Hadoop

    • 发布日期:2017-08-22
    • 文件大小:51byte
    • 提供者:huangyueranbbc
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。, 主要内容包括:, ■ 完成超大量交易的购物篮分析。, ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。, ■ 使用超大基因组数据完成DNA和RNA测序。, ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。, ■ 推荐算法和成对文档相似性。, ■ 线性回
  3. 所属分类:Hadoop

    • 发布日期:2018-03-17
    • 文件大小:172mb
    • 提供者:tianshan2010
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要内容包括: ■ 完成超大量交易的购物篮分析。 ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 ■ 使用超大基因组数据完成DNA和RNA测序。 ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 ■ 推荐算法和成对文档相似性。 ■ 线性回归、Cox回归
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:100mb
    • 提供者:luofazha2012
  1. 数据算法:Hadoop、Spark大数据处理技巧

  2. 如果你准备深入研究MapReduce框架来处理大数据集,本书非常实用,通过提供丰富的算法和工具,它会循序渐进地带你探索MapReduce世界,用Apache Hadoop或Apache Spark构建分布式MapReduce应用时通常都需要用到这些算法和工具。每一章分别提供一个实例来解决一个大规模计算问题,如构建推荐系统。你会了解如何用代码实现适当的MapReduce解决方案,而且可以在你的项目中具体应用这些解决方案。
  3. 所属分类:其它

    • 发布日期:2018-08-02
    • 文件大小:23mb
    • 提供者:qm13416479599
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。   主要内容包括:   ■ 完成超大量交易的购物篮分析。   ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。   ■ 使用超大基因组数据完成DNA和RNA测序。   ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。   ■ 推荐算法和成对文档相似性。
  3. 所属分类:Java

    • 发布日期:2018-01-13
    • 文件大小:76mb
    • 提供者:arterhwq
  1. AKeyword-AwareService Recommendation Method on MapReduce

  2. 在动态、复杂的云计算环境下,面对众多功能相似、QoS各异的候选服务,用户对服务推荐的可信度更加重视。为了保证服务推荐的准确度和可信度,仅需要将用户的需求与服务描述进行匹配,更需要获取用户偏好,基于用户偏好为用户推荐符合个性化需求的服务。为了提高用户偏好获取的准确度,可以从用户的反馈信息(如文本评论、评分等)提取有效信息,为目标用户找出偏好相似的可信任历史用户。为了准确从用户的文本评论中获取用户偏好,可利用自然语言处理知识、本体论知识对领域专业词汇以及用户历史评论信息处理分析构建领域映射词库,将
  3. 所属分类:其它

    • 发布日期:2018-01-28
    • 文件大小:1mb
    • 提供者:mshunmei
  1. 基于mapreduce的小型电影推荐系统

  2. 基于mapreduce的小型电影推荐系统,使用javaweb的方式实现,
  3. 所属分类:Hadoop

    • 发布日期:2019-01-07
    • 文件大小:48mb
    • 提供者:qq_41945793
  1. MapReduce基于物品的协同过滤算法实现电影推荐系统

  2. 本文档主要是协同过滤算法实现的电影推荐系统源码,对应本人博客MapReduce基于物品的协同过滤算法实现电影推荐系统。欢迎大家关注数据科学,关注我。谢谢
  3. 所属分类:Hadoop

  1. Data Science from Scratch First Principles with Python

  2. 数据科学入门,第二版, 介绍数据科学基本知识的重量级读本,Google数据科学家作品。   数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。   作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。   通过阅读本书,你可以:
  3. 所属分类:机器学习

    • 发布日期:2019-04-28
    • 文件大小:4mb
    • 提供者:nchwang
  1. 八斗大虚据第九期完整版.docx

  2. 一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。 第二阶段:这一阶段会学习FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能
  3. 所属分类:Hadoop

    • 发布日期:2019-07-24
    • 文件大小:12kb
    • 提供者:qq_43648927
  1. Hadoop课程设计说明书(1).doc

  2. 设计一个基于Hadoop的商品推荐系统,商品推荐引擎大致可以分为5部分,分别是:计算用户的购买向量、计算物品的相似度矩阵、计算推荐度及相关处理、数据导入数据库和对于整个项目的全部作业控制。通过MapReduce程序将HDFS集群上的数据保存到MySQL数据库中。系统做好后,进行测试。最终完成实验设计。
  3. 所属分类:Windows Server

    • 发布日期:2020-04-30
    • 文件大小:12mb
    • 提供者:qq_43793248
  1. Hadoop商品推荐系统-源码.zip

  2. 运用Hadoop 运用协同过滤算法 基于Hadoop的商品推荐系统的设计源码和设计指导书 使用Eclipse的export功能把所有源码打包,然后把打包后的jar文件拷贝到hadoop集群的$HADOOP_HOME/share/hadoop/mapreduce/lib目录下面。这一步相当重要,否则项目将无法找到相关类。注意,如果搭建的是全分布集群,那么需要把这个jar包拷贝到每一个集群节点的该目录下,否则会运行时会报错,提示找不到相关类的定义。
  3. 所属分类:Hadoop

    • 发布日期:2020-03-17
    • 文件大小:267kb
    • 提供者:qq_32663797
  1. 基于mapreduce的小型电影推荐系统的数据集

  2. 基于mapreduce的小型电影推荐系统的数据集
  3. 所属分类:Hadoop

    • 发布日期:2019-07-01
    • 文件大小:1kb
    • 提供者:qq_41945793
  1. 基于Hadoop平台的个性化新闻推荐系统的设计

  2. 为使互联网用户快捷地查找所需信息,个性化推荐系统的优势得到了体现和运用。该系统设计的目的是为广大网民在浏览新闻时提供一个个性化的新闻推荐系统,实现对新闻数据的协同过滤推荐处理。系统利用 Hadoop的MapReduce模型实现并行快速地聚类海量新闻数据,大大提高了数据处理的速度,聚类使得新闻之间的相似度得以体现,再利用不同的协同过滤算法实现个性化的新闻推荐。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:224kb
    • 提供者:weixin_38747946
  1. (第7篇)八斗学习课堂笔记-【01、02】推荐系统

  2. 第一步:召回阶段:用token检索item,(比如8个item) 第二步:过滤阶段:把劣质的item过滤掉,(剩余5个item) 第三步:排序,把好的item排前面 第四步:截断,取TopN 其中,第一步和第二步属于粗排阶段,侧重于召回;第三、第四步属于精排阶段,侧重于准确。 建库: ================================================================== 【02】MR实践复习 1、架构 2、mapreduce(复习) 2.1 M
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:446kb
    • 提供者:weixin_38602189
  1. hadoop实现购物商城推荐系统

  2. 1,商城:是单商家,多买家的商城系统。数据库是mysql,语言java。2,sqoop1.9.33:在mysql和hadoop中交换数据。3,hadoop2.2.0:这里用于练习的是伪分布模式。4,完成内容:喜欢该商品的人还喜欢,相同购物喜好的好友推荐。1,通过sqoop从mysql中将“用户收藏商品”(这里用的是用户收藏商品信息表作为推荐系统业务上的依据,业务依据可以很复杂。这里主要介绍推荐系统的基本原理,所以推荐依据很简单)的表数据导入到hdfs中。2,用MapReduce实现推荐算法。3,
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:429kb
    • 提供者:weixin_38567962
  1. hadoop实现购物商城推荐系统

  2. 1,商城:是单商家,多买家的商城系统。数据库是mysql,语言java。2,sqoop1.9.33:在mysql和hadoop中交换数据。3,hadoop2.2.0:这里用于练习的是伪分布模式。4,完成内容:喜欢该商品的人还喜欢,相同购物喜好的好友推荐。1,通过sqoop从mysql中将“用户收藏商品”(这里用的是用户收藏商品信息表作为推荐系统业务上的依据,业务依据可以很复杂。这里主要介绍推荐系统的基本原理,所以推荐依据很简单)的表数据导入到hdfs中。2,用MapReduce实现推荐算法。3,
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:429kb
    • 提供者:weixin_38516380
« 12 »