您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Scala for Machine Learning.pdf

  2. Scala for Machine Learning.pdf
  3. 所属分类:专业指导

    • 发布日期:2016-07-16
    • 文件大小:6mb
    • 提供者:u011500720
  1. Apache Spark的设计与实现 PDF中文版

  2. 本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”,因为本文的主要目的不是去解读实现代码,而是尽量有逻辑地,从设计与实现原理的角度,来理解 job 从产生到执行完成的整个过程,进而去理解整个系统。 讨论系统的设计与实现有很多方法,本文选择 问题驱动 的方式,一开始引入问题,然后分问题逐步深入。从一个典型的 job 例子入手,逐渐讨论 job
  3. 所属分类:spark

    • 发布日期:2017-07-12
    • 文件大小:25mb
    • 提供者:whulovely
  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62byte
    • 提供者:huoyongjie698
  1. 基于spark的系统信息熵 条件熵计算

  2. 不错的开源利用spark计算CMIM, MRMR,MIFS等方法的spark库, 作者仿照spark ml mllib库的feature selection的功能, 扩展了支持系统信息熵计算的方式。 如果需要具体结果, 可以直接调用ml.feature中对应方法
  3. 所属分类:spark

    • 发布日期:2018-05-02
    • 文件大小:528kb
    • 提供者:ggyydm
  1. MACHINE LEARNING WITH SPARK

  2. Nick首先介绍了Spark编程模型及其组件,比如SparkContext和弹性分布式数据集(RDD)。同时,他谈到了如何使用不同的编程语言,比如Scala、Java和Python来编写Spark程序。
  3. 所属分类:机器学习

  1. 实验 Spark ML Bisecting k-means聚类算法使用

  2. 实验 Spark ML Bisecting k-means聚类算法使用,实验文档
  3. 所属分类:spark

    • 发布日期:2018-10-18
    • 文件大小:30kb
    • 提供者:yxgxy270187133
  1. 1、基于spark的机器学习课程介绍.mp4

  2. spark机器学习,利用scala语言进行实现ml计算。通过本课程可以快速熟悉机器学习的一些东西,并且了解spark的运行机制。
  3. 所属分类:spark

  1. Spark 机器学习.xmind.zip

  2. MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且容易,思维导图中详细地描述了Spark ML机器学习库相关的技术点及使用示例
  3. 所属分类:互联网

  1. IBM-AI-Engineering-Professional-Certificate:整个IBM AI Engineering Professional认证的学习资料,测验和作业解决方案-源码

  2. IBM AI工程专业证书 关于此专业证书 人工智能(AI)正在彻底改变整个行业,改变了跨部门公司利用数据做出决策的方式。 为了保持竞争力,组织需要合格的AI工程师,他们使用机器学习算法和深度学习神经网络等前沿方法为业务提供数据驱动的可行情报。 此六门课程的专业证书旨在为您提供成功从事AI或ML工程师职业所需的工具。 您将使用Python之类的编程语言掌握机器学习和深度学习的基本概念,包括有监督和无监督的学习。 您将应用流行的机器学习和深度学习库(例如SciPy,ScikitLearn,Kera
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:37mb
    • 提供者:weixin_42131405
  1. attic-predictionio:PredictionIO,面向开发人员和ML工程师的机器学习服务器-源码

  2. Apache PredictionIO是面向开发人员,数据科学家和最终用户的开源机器学习框架。它支持事件收集,算法部署,评估,通过REST API查询预测结果。它基于可扩展的开源服务,例如Hadoop,HBase(和其他数据库),Elasticsearch,Spark,并实现了所谓的Lambda体系结构。 要开始使用,请访问 ! 目录 安装 一些安装选项可用。 快速开始 指南 指南 指南 错误和功能请求 使用报告错误或请求新功能。 文献资料 此回购中docs/manual目录中包含的docs/m
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:12mb
    • 提供者:weixin_42097557
  1. PySpark-ML-源码

  2. PySpark-ML 在此存储库中,将演示使用PySpark的多类文本分类的Python编程语言编写Spark的功能。 数据结构 df = spark . read . csv ( '/home/renos/Downloads/sf-crime/train.csv' , header = True , inferSchema = True ) print ( df . columns ) print ( len ( df . columns )) ['Dates', 'Category',
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:39kb
    • 提供者:weixin_42168230
  1. Spark-ML-Platform:有关如何结合Docker,Django,Postgres,Celery和RabbitMQ的示例-源码

  2. Spark-ML平台 以及有关使用这些技术的示例。 启动 docker-compose up --build 该项目试图创建一个MLOps平台。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:35kb
    • 提供者:weixin_42099633
  1. The-Spark-Foundation:回购包含数据科学和业务分析项目BEGINNERINTERMEDIATEADVANCED级别-源码

  2. The-Sparks-Foundation-数据科学实习 数据科学与业务分析任务 任务1-使用监督的ML进行预测(级别-初学者) 根据编号预测学生的百分比学习时间。 这是一个简单的线性回归任务,因为它仅涉及2个变量。 #Task 2-使用无监督的ML进行预测(级别-初学者) 从给定的“虹膜”数据集中,预测最佳聚类数并直观地表示出来。 #Task 6-使用决策树算法进行预测 创建决策树分类器并以图形方式对其进行可视化 目的是,如果我们向该分类器提供任何新数据,它将能够相应地预测正确的分类
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:249kb
    • 提供者:weixin_42134234
  1. systemds:用于端到端数据科学生命周期的开源ML系统-源码

  2. 注意: SystemDS已合并回Apache SystemML,成为 (2020年3月27日)。 系统DS 概述: SystemDS是用于端到端数据科学生命周期的通用系统,从数据集成,清理和功能工程到有效的本地和分布式ML模型培训,再到部署和服务,都可从其实现。 为此,我们旨在为(1)数据科学生命周期的不同任务以及(2)具有不同专业知识的用户提供具有R形语法的声明性语言堆栈。 这些高级脚本被编译为本地,内存CPU和GPU操作以及Apache Spark上的分布式操作的混合执行计划。 与提供均质
  3. 所属分类:其它

  1. Apache-pyspark-hadoop-using-databricks:说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法-源码

  2. Apache-pyspark-hadoop使用数据块 说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法 发布在此存储库上的笔记本是使用databricks开发的,databricks是spark创始人创建的一个开源平台,您可以选择以下提到的其他平台: 1)在虚拟机/本地机上使用ubuntu(或) 2)AWS EC2(或) 3)AWS EMR(或) 4)数据砖。 为了使用数据砖在此github存储库中执行笔记本,请创建一个社区版帐户,然后开始
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:80kb
    • 提供者:weixin_42131405
  1. 5机器学习与火花ML-源码

  2. 5机器学习与火花ML 1.介绍Spark.ML ALS(交替最小二乘)。 1ºImportamos todas lalibreríasyademásesta nueva from pyspark . ml . recommendation import ALS 2ºCreamosfunciónpara cargar los datos,y la sesion de spark def loadMovieNames (): movieNames = {} # CHAN
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:988kb
    • 提供者:weixin_42125867
  1. Spark:一个高效的分布式计算系统

  2. Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。其架构如下图所示:Spark的中间数据放到内存中,对于迭代运算效率更高。Spark更适合于迭代运算比较多的ML和D
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:306kb
    • 提供者:weixin_38648396
  1. Spark大数据处理系列之MachineLearning

  2. 最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(SparkMLlib),包括各种机器学习算法:协同过滤算法、聚类算法、分类算法和其他算法。在前面的《Spark大数据处理》系列文章,介绍ApacheSpark框架,介绍如何使用SparkSQL库的SQL接口去访问数据,使用SparkStreaming进行实时流式数据处理和分析。在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:244kb
    • 提供者:weixin_38698590
  1. projectionio:PredictionIO,面向开发人员和ML工程师的机器学习服务器-源码

  2. Apache PredictionIO是面向开发人员,数据科学家和最终用户的开源机器学习框架。 它支持事件收集,算法部署,评估,通过REST API查询预测结果。 它基于可扩展的开源服务,例如Hadoop,HBase(和其他数据库),Elasticsearch,Spark,并实现了所谓的Lambda体系结构。 要开始使用,请访问 ! 目录 安装 提供一些安装选项。 快速开始 指南 指南 指南 错误和功能请求 使用报告错误或请求新功能。 文献资料 该文档包含在docs/manual目录中的此
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:12mb
    • 提供者:weixin_42099987
  1. sagemaker-spark:Amazon SageMaker的Spark库-源码

  2. 贤者之星 SageMaker Spark是开源Spark库。 使用SageMaker Spark,您可以使用Amazon SageMaker阶段构建Spark ML Pipeline 。 这些管道交错了本机Spark ML阶段以及与SageMaker培训和模型托管进行交互的阶段。 随着SageMaker星火,你可以在亚马逊SageMaker从星火培训DataFrame S使用亚马逊提供的ML算法,如K-均值聚类或XGBoost,并作出预测的DataFrame对阵SageMaker端点托管您训
  3. 所属分类:其它

« 12 3 4 5 »