您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. sparkMllib协同过滤测试数据(ml-1m)

  2. spark Mllib 协同过滤测试数据包含一部分用户对电影的评分数据(用于测试)
  3. 所属分类:数据库

    • 发布日期:2017-04-06
    • 文件大小:5mb
    • 提供者:u014028392
  1. SparkMllib

  2. 精确讲述了SparkML里面的一些算法用途以及综合算法的介绍
  3. 所属分类:Java

    • 发布日期:2017-12-22
    • 文件大小:1mb
    • 提供者:syz_001
  1. 2.Spark编译与部署(下)--Spark编译安装.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 5.Hive(上)--Hive介绍及部署.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 6.SparkSQL(下)--Spark实战应用.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:3mb
    • 提供者:u010195673
  1. 6.SparkSQL(中)--深入了解运行计划及调优.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:2mb
    • 提供者:u010195673
  1. 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:989kb
    • 提供者:u010195673
  1. 8.SparkMLlib(下)--SparkMLlib实战.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 9.SparkGraphX介绍及实例.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 10.分布式内存文件系统Tachyon介绍及安装部署.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. Spark 入门实战系列

  2. Spark 入门实战系列,适合初学者,文档包括十部分内容,质量很好,为了感谢文档作者,也为了帮助更多的人入门,传播作者的心血,特此友情转贴: 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.
  3. 所属分类:spark

    • 发布日期:2018-01-18
    • 文件大小:32mb
    • 提供者:zy205
  1. sparkmllib机器学习源码

  2. sparkmllib机器学习.
  3. 所属分类:spark

    • 发布日期:2018-11-01
    • 文件大小:54mb
    • 提供者:xiaolin93
  1. Spark专刊】SparkMLlib机器学习(作者:李军).rar

  2. 该文档为SparkMLlib机器学习pdf,内容高清,章节完善,仅供学习使用
  3. 所属分类:spark

    • 发布日期:2019-10-18
    • 文件大小:1mb
    • 提供者:ddq920320
  1. 使用Spark MLlib给豆瓣用户推荐电影.doc

  2. 完整项目链,机器学习到用户推荐,实现精准营销! ALS算法 LS是alternating least squares的缩写 , 意为交替最小二乘法。该方法常用于基于矩阵分解的推荐系统中。例如:将用户(user)对商品(item)的评分矩阵分解为两个矩阵:一个是用户对商品隐含特征的偏好矩阵,另一个是商品所包含的隐含特征的矩阵。在这个矩阵分解的过程中,评分缺失项得到了填充,也就是说我们可以基于这个填充的评分来给用户最商品推荐了。
  3. 所属分类:spark

    • 发布日期:2019-12-28
    • 文件大小:454kb
    • 提供者:qq_45557581
  1. Databricks孟祥瑞:ALS在SparkMLlib中的实现

  2. 摘要:MLlib在1.3中添加了不少机器学习及数据挖掘算法:研究主题分布的LDA、估计点集分布的GMM、提取频繁项集的FP-growth等等。本文主要聚焦ALS的实现及其在1.3中的提升。深受用户喜爱的大数据处理平台ApacheSpark1.3于前不久发布,MLlib作为Spark负责机器学习(ML)的核心组件在1.3中添加了不少机器学习及数据挖掘的算法:研究主题分布的latentDirichletallocation(LDA)、估计点集分布的高斯混合模型(GMM)、提取频繁项集的FP-grow
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:174kb
    • 提供者:weixin_38717843
  1. SparkMLlib-DecisionTree源码分析

  2. 以决策树作为开始,因为简单,而且也比较容易用到,当前的boosting或randomforest也是常以其为基础的决策树算法本身参考之前的blog,其实就是贪婪算法,每次切分使得数据变得最为有序无序,nodeimpurity对于分类问题,我们可以用熵entropy或Gini来表示信息的无序程度对于回归问题,我们用方差Variance来表示无序程度,方差越大,说明数据间差异越大用于表示,由父节点划分后得到子节点,所带来的impurity的下降,即有序性的增益下面直接看个regression的例子,
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:137kb
    • 提供者:weixin_38697979
  1. 如何使用SparkMLlib构建分类模型?

  2. 1.预测互联网用户对在线广告的点击概率(二分类问题);2.检测欺诈(二分类问题,欺诈或者不欺诈);3.预测拖欠贷款(二分类问题);4.对图片、音频、视频进行分类(多分类问题);5.对新闻、网页或者其他内容进行分类或者打标签(多分类);6.发现垃圾邮件、垃圾页面、网络入侵和其他恶意行为;7.检测故障,比如计算机系统或者网络故障检测;8.预测顾客或者客户中谁有可能停止使用某个产品或服务。1.线性模型原理:对样本的预测结果(目标变量)进行建模,即对输入特征应用简单的线性预测函数。1.1逻辑回归1.2线
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:226kb
    • 提供者:weixin_38569203
  1. 如何使用SparkMLlib构建分类模型?

  2. 1.预测互联网用户对在线广告的点击概率(二分类问题);2.检测欺诈(二分类问题,欺诈或者不欺诈);3.预测拖欠贷款(二分类问题);4.对图片、音频、视频进行分类(多分类问题);5.对新闻、网页或者其他内容进行分类或者打标签(多分类);6.发现垃圾邮件、垃圾页面、网络入侵和其他恶意行为 ;7.检测故障,比如计算机系统或者网络故障检测;8.预测顾客或者客户中谁有可能停止使用某个产品或服务。1.线性模型原理:对样本的预测结果(目标变量)进行建模,即对输入特征应用简单的线性预测函数。 1.1逻辑回归 1
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:226kb
    • 提供者:weixin_38569651
  1. SparkMLlib-DecisionTree源码分析

  2. 以决策树作为开始,因为简单,而且也比较容易用到,当前的boosting或random forest也是常以其为基础的决策树算法本身参考之前的blog,其实就是贪婪算法,每次切分使得数据变得最为有序无序,nodeimpurity对于分类问题,我们可以用熵entropy或Gini来表示信息的无序程度 对于回归问题,我们用方差Variance来表示无序程度,方差越大,说明数据间差异越大用于表示,由父节点划分后得到子节点,所带来的impurity的下降,即有序性的增益下面直接看个regres
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:137kb
    • 提供者:weixin_38658471
  1. Databricks孟祥瑞:ALS在SparkMLlib中的实现

  2. 摘要:MLlib在1.3中添加了不少机器学习及数据挖掘算法:研究主题分布的LDA、估计点集分布的GMM、提取频繁项集的FP-growth等等。本文主要聚焦ALS的实现及其在1.3中的提升。深受用户喜爱的大数据处理平台ApacheSpark1.3于前不久发布,MLlib作为Spark负责机器学习(ML)的核心组件在1.3中添加了不少机器学习及数据挖掘的算法:研究主题分布的latentDirichletallocation(LDA)、估计点集分布的高斯混合模型(GMM)、提取频繁项集的FP-grow
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:159kb
    • 提供者:weixin_38543950
« 12 »