搜索资源 - spark，ml - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - spark，ml

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

Scala for Machine Learning.pdf
Scala for Machine Learning.pdf
所属分类：专业指导
- 发布日期：2016-07-16
- 文件大小：6mb
- 提供者：u011500720

Apache Spark的设计与实现 PDF中文版
本文主要讨论 Apache Spark 的设计与实现，重点关注其设计思想、运行原理、实现架构及性能调优，附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”，因为本文的主要目的不是去解读实现代码，而是尽量有逻辑地，从设计与实现原理的角度，来理解 job 从产生到执行完成的整个过程，进而去理解整个系统。讨论系统的设计与实现有很多方法，本文选择问题驱动的方式，一开始引入问题，然后分问题逐步深入。从一个典型的 job 例子入手，逐渐讨论 job
所属分类：spark
- 发布日期：2017-07-12
- 文件大小：25mb
- 提供者：whulovely

Spark 2.0.2 Spark 2.2 中文文档
本资源为网页，不是PDF Apache Spark 2.0.2 中文文档 Spark 概述编程指南快速入门 Spark 编程指南概述 Spark 依赖 Spark 的初始化 Shell 的使用弹性分布式数据集（RDDS）并行集合外部数据集 RDD 操作 RDD 持久化共享变量 Broadcast Variables （广播变量） Accumulators （累加器）部署应用到集群中使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
所属分类：spark
- 发布日期：2017-12-07
- 文件大小：62byte
- 提供者：huoyongjie698

基于spark的系统信息熵条件熵计算
不错的开源利用spark计算CMIM， MRMR，MIFS等方法的spark库，作者仿照spark ml mllib库的feature selection的功能，扩展了支持系统信息熵计算的方式。如果需要具体结果，可以直接调用ml.feature中对应方法
所属分类：spark
- 发布日期：2018-05-02
- 文件大小：528kb
- 提供者：ggyydm

MACHINE LEARNING WITH SPARK
Nick首先介绍了Spark编程模型及其组件，比如SparkContext和弹性分布式数据集（RDD）。同时，他谈到了如何使用不同的编程语言，比如Scala、Java和Python来编写Spark程序。
所属分类：机器学习
- 发布日期：2018-05-25
- 文件大小：5mb
- 提供者：chocolate_chuqi

实验 Spark ML Bisecting k-means聚类算法使用
实验 Spark ML Bisecting k-means聚类算法使用，实验文档
所属分类：spark
- 发布日期：2018-10-18
- 文件大小：30kb
- 提供者：yxgxy270187133

1、基于spark的机器学习课程介绍.mp4
spark机器学习，利用scala语言进行实现ml计算。通过本课程可以快速熟悉机器学习的一些东西，并且了解spark的运行机制。
所属分类：spark
- 发布日期：2020-07-30
- 文件大小：137mb
- 提供者：huohuangfengcheng

Spark 机器学习.xmind.zip
MLlib是Spark的机器学习（ML）库。其目标是使实用的机器学习可扩展且容易，思维导图中详细地描述了Spark ML机器学习库相关的技术点及使用示例
所属分类：互联网
- 发布日期：2020-09-13
- 文件大小：4mb
- 提供者：weixin_32265569

IBM-AI-Engineering-Professional-Certificate:整个IBM AI Engineering Professional认证的学习资料，测验和作业解决方案-源码
IBM AI工程专业证书关于此专业证书人工智能（AI）正在彻底改变整个行业，改变了跨部门公司利用数据做出决策的方式。为了保持竞争力，组织需要合格的AI工程师，他们使用机器学习算法和深度学习神经网络等前沿方法为业务提供数据驱动的可行情报。此六门课程的专业证书旨在为您提供成功从事AI或ML工程师职业所需的工具。您将使用Python之类的编程语言掌握机器学习和深度学习的基本概念，包括有监督和无监督的学习。您将应用流行的机器学习和深度学习库（例如SciPy，ScikitLearn，Kera
所属分类：其它
- 发布日期：2021-03-26
- 文件大小：37mb
- 提供者：weixin_42131405

attic-predictionio:PredictionIO，面向开发人员和ML工程师的机器学习服务器-源码
Apache PredictionIO是面向开发人员，数据科学家和最终用户的开源机器学习框架。它支持事件收集，算法部署，评估，通过REST API查询预测结果。它基于可扩展的开源服务，例如Hadoop，HBase（和其他数据库），Elasticsearch，Spark，并实现了所谓的Lambda体系结构。要开始使用，请访问！目录安装一些安装选项可用。快速开始指南指南指南错误和功能请求使用报告错误或请求新功能。文献资料此回购中docs/manual目录中包含的docs/m
所属分类：其它
- 发布日期：2021-03-21
- 文件大小：12mb
- 提供者：weixin_42097557

PySpark-ML-源码
PySpark-ML 在此存储库中，将演示使用PySpark的多类文本分类的Python编程语言编写Spark的功能。数据结构 df = spark . read . csv ( '/home/renos/Downloads/sf-crime/train.csv' , header = True , inferSchema = True ) print ( df . columns ) print ( len ( df . columns )) ['Dates', 'Category',
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：39kb
- 提供者：weixin_42168230

Spark-ML-Platform:有关如何结合Docker，Django，Postgres，Celery和RabbitMQ的示例-源码
Spark-ML平台以及有关使用这些技术的示例。启动 docker-compose up --build 该项目试图创建一个MLOps平台。
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：35kb
- 提供者：weixin_42099633

The-Spark-Foundation:回购包含数据科学和业务分析项目BEGINNERINTERMEDIATEADVANCED级别-源码
The-Sparks-Foundation-数据科学实习数据科学与业务分析任务任务1-使用监督的ML进行预测（级别-初学者）根据编号预测学生的百分比学习时间。这是一个简单的线性回归任务，因为它仅涉及2个变量。 #Task 2-使用无监督的ML进行预测（级别-初学者）从给定的“虹膜”数据集中，预测最佳聚类数并直观地表示出来。 #Task 6-使用决策树算法进行预测创建决策树分类器并以图形方式对其进行可视化目的是，如果我们向该分类器提供任何新数据，它将能够相应地预测正确的分类
所属分类：其它
- 发布日期：2021-03-14
- 文件大小：249kb
- 提供者：weixin_42134234

systemds:用于端到端数据科学生命周期的开源ML系统-源码
注意： SystemDS已合并回Apache SystemML，成为（2020年3月27日）。系统DS 概述： SystemDS是用于端到端数据科学生命周期的通用系统，从数据集成，清理和功能工程到有效的本地和分布式ML模型培训，再到部署和服务，都可从其实现。为此，我们旨在为（1）数据科学生命周期的不同任务以及（2）具有不同专业知识的用户提供具有R形语法的声明性语言堆栈。这些高级脚本被编译为本地，内存CPU和GPU操作以及Apache Spark上的分布式操作的混合执行计划。与提供均质
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：7mb
- 提供者：weixin_42116681

Apache-pyspark-hadoop-using-databricks:说明使用pyspark执行的一些基本活动，并使用MLlib API执行一些机器学习（ML）算法-源码
Apache-pyspark-hadoop使用数据块说明使用pyspark执行的一些基本活动，并使用MLlib API执行一些机器学习（ML）算法发布在此存储库上的笔记本是使用databricks开发的，databricks是spark创始人创建的一个开源平台，您可以选择以下提到的其他平台： 1）在虚拟机/本地机上使用ubuntu（或） 2）AWS EC2（或） 3）AWS EMR（或） 4）数据砖。为了使用数据砖在此github存储库中执行笔记本，请创建一个社区版帐户，然后开始
所属分类：其它
- 发布日期：2021-03-07
- 文件大小：80kb
- 提供者：weixin_42131405

5机器学习与火花ML-源码
5机器学习与火花ML 1.介绍Spark.ML ALS（交替最小二乘）。 1ºImportamos todas lalibreríasyademásesta nueva from pyspark . ml . recommendation import ALS 2ºCreamosfunciónpara cargar los datos，y la sesion de spark def loadMovieNames (): movieNames = {} # CHAN
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：988kb
- 提供者：weixin_42125867

Spark：一个高效的分布式计算系统
Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架，Spark基于mapreduce算法实现的分布式计算，拥有HadoopMapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。其架构如下图所示：Spark的中间数据放到内存中，对于迭代运算效率更高。Spark更适合于迭代运算比较多的ML和D
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：306kb
- 提供者：weixin_38648396

Spark大数据处理系列之MachineLearning
最近几年，机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库（SparkMLlib），包括各种机器学习算法：协同过滤算法、聚类算法、分类算法和其他算法。在前面的《Spark大数据处理》系列文章，介绍ApacheSpark框架，介绍如何使用SparkSQL库的SQL接口去访问数据，使用SparkStreaming进行实时流式数据处理和分析。在本篇文章，作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：244kb
- 提供者：weixin_38698590

projectionio：PredictionIO，面向开发人员和ML工程师的机器学习服务器-源码
Apache PredictionIO是面向开发人员，数据科学家和最终用户的开源机器学习框架。它支持事件收集，算法部署，评估，通过REST API查询预测结果。它基于可扩展的开源服务，例如Hadoop，HBase（和其他数据库），Elasticsearch，Spark，并实现了所谓的Lambda体系结构。要开始使用，请访问！目录安装提供一些安装选项。快速开始指南指南指南错误和功能请求使用报告错误或请求新功能。文献资料该文档包含在docs/manual目录中的此
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：12mb
- 提供者：weixin_42099987

sagemaker-spark：Amazon SageMaker的Spark库-源码
贤者之星 SageMaker Spark是开源Spark库。使用SageMaker Spark，您可以使用Amazon SageMaker阶段构建Spark ML Pipeline 。这些管道交错了本机Spark ML阶段以及与SageMaker培训和模型托管进行交互的阶段。随着SageMaker星火，你可以在亚马逊SageMaker从星火培训DataFrame S使用亚马逊提供的ML算法，如K-均值聚类或XGBoost，并作出预测的DataFrame对阵SageMaker端点托管您训
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：1mb
- 提供者：weixin_42176827

« 12 3 4 5 »