您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. udacity-data-modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型-源码

  2. 使用Postgres进行数据建模 罗德里戈·科埃略(Rodrigo Coelho) 介绍 这是Udacity数据工程纳米学位的项目。 在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力 概括 应用所有ETL步骤以为Sparkify提供星型模式模型。 选择了启动模式,因为它是最易于分析的模型之一。 总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。 歌曲和日志数据。 歌曲数据可提供歌曲和艺术
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:502kb
    • 提供者:weixin_42117032
  1. Data-Modeling-With-PostgreSQL:PostgreSQL进行数据建模和ETL管道以实现Udacity数据工程纳米级-源码

  2. 目标: 将以下概念付诸实践: 数据建模(应用概念建模,然后构造事实表和维度表) 数据库模式(将特定的模式应用于事实和维度表,适合我们的数据大小和结构=>星型模式) ETL管道(构造ETL管道以将数据从日志文件传输到数据库表) 项目描述: 该项目的目的是为一个名为Sparkify的虚构音乐流服务创建SQL分析数据库。 Sparkify的分析团队致力于了解用户在公司音乐应用上播放歌曲的内容,时间和方式。 分析师需要一种简单的方法来查询和分析数据,这些数据当前存储在应用程序上用户活动的
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:480kb
    • 提供者:weixin_42128270
  1. Starbucks_Capstone:这是我的数据科学Udacity纳米学位课程的最后一个项目-源码

  2. 星巴克顶石挑战 目录 项目动机 星巴克提供的此数据集包含模拟数据,这些数据模拟了客户在其奖励移动应用程序上的行为。 星巴克每隔几天就会向移动应用程序的用户发送一个报价。 要约可以仅仅是饮料的广告或诸如折扣或BOGO(买一送一)之类的实际要约。 该项目的目的是通过组合三个提供的数据集来分析某些客户群体对某些报价类型的响应程度。 为了实现此目标,我必须先清理并组合提供的三个数据集,然后通过可视化的方式探索数据。 然后对数据进行建模,以便能够确定是否查看了要约,然后由成员完成了要约。 最后,我将Gra
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:195kb
    • 提供者:weixin_42128015
  1. Udacity-Data-Engineering-P1-Data-Modeling-With-Postgres-源码

  2. 项目1:使用Postgres进行数据建模 介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,他们没有一种简单的方法来查询数据,该数据位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 分析团队希望像您一样的数据工程师使用表来创建Postgres数据库,该表旨在优化歌曲播放分析中的查询。 您的任务是为该分析创建数据库架构和ETL管道。
  3. 所属分类:其它

  1. DataModelingUdacity:Trabalho光纤数据建模Udacity-当前数据工程-源码

  2. •••• 关于 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 在该项目中,基于事实表和四个维度创建了一个星型模型,以分析用户正在收听哪些歌曲的信息。 苏玛莉 该项目具有以下文件 test.ipynb->显示每个表的前几行,以便您检查数据库。 create_tables.py->删除并创建表。 每次运行ETL脚本之前,您都运行此文件以重置表。 etl.ipynb->从song_
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:59kb
    • 提供者:weixin_42169245
  1. 西雅图Airbnb上的数据分析:西雅图Airbnb开放数据的数据分析-源码

  2. 西雅图Airbnb开放数据的数据分析 西雅图Airbnb开放数据的数据分析-https: 清理,分析,建模和可视化Jupyter笔记本中的数据 #使用的图书馆: 大熊猫 麻木 matplotlib 斯克莱恩 海生的 项目动机 该项目是由udacity设计的,这是Udacity数据科学纳米学位计划中的第一个项目,它的数据分析是通过CRISP-DM过程完成的。 CRISP-DM过程通常在数据挖掘时使用,并且非常可靠且用户友好。 这是所涉及步骤的简短说明- 了解业务 了解数据 数据准备 造
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:19mb
    • 提供者:weixin_42109598
  1. Finding_Donors:根据人口普查数据识别某人捐赠可能性的应用程序-源码

  2. Finding_Donors 从Udacity寻找捐赠者项目 项目概况 该项目将机器学习算法与美国人口普查数据一起应用,以确定一个人是否会向慈善机构捐款,以及在做出此决定时最重要的特征是什么。 软件要求(参考:Udacity) 档案 census.csv->根据1994年美国人口普查建模的主要人口普查数据源取自 find_donors.py->清除数据,在优化的模型上训练数据并输出结果的主要方法 Models.py->包,其中包含清理的数据并使用各种监督的学习算法来运行它。
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:672kb
    • 提供者:weixin_42126865
  1. Udacity-数据建模-项目-源码

  2. Udacity-数据建模-项目
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:10kb
    • 提供者:weixin_42099936
  1. nanodataeng-capstone:Udacity纳米数据工程学位,Capstone项目-源码

  2. 电影评论情感分析 该项目遵循以下步骤: 步骤1:确定项目范围并收集数据 第2步:探索和评估数据 步骤3:定义数据模型 步骤4:运行ETL对数据建模 步骤5:完成项目编写 项目总结 本项目根据和提供的数据表达了艺术家评论情感和电影评论情感的 我们的数据管道的目标是向S3发布包含以下摘要信息的PDF报告: 十大电影 最差10部电影 复习情绪分布 最佳评论电影中的前10名演员 多年来的IMDb平均投票与TMDb情绪评论 我们的数据来源是: 完整的技术规格 有关项目对端到端的理解以及设置说明,
  3. 所属分类:其它

  1. 顶石-源码

  2. 顶石 动机 这是我在Udacity Full Stack Developer Nanodegree计划中的最终项目 它结合了从该课程中学到的所有技能。 这些技能包括: WebSQL和数据建模使用SQLAlchemy执行CRUD操作并创建关系数据库 API开发和文档创建RESTful API,编写API文档并使用单元测试和邮递员集合执行TDD 身份和访问管理使用Auth0和JWT令牌实现基于角色的访问控制 服务器部署 将应用程序部署到Heroku 申请网址 该应用程序通过部署到heroku。
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:18kb
    • 提供者:weixin_42140625
  1. Disaster_Response_Pipeline:灾难恢复项目,是Udacity的纳米级数据科学课程的一部分,涵盖数据工程的各个方面,例如ETL管道,NLP和机器学习管道-源码

  2. 灾害响应管道项目 目录: 项目介绍 在这个项目中,我将分析提供的数据。 数据包含在现实生活中灾难期间收到的预先标记的推文和文本消息。 目的是使用ETL(提取,转换,加载)流水线准备数据,然后使用ML(机器学习)流水线建立监督学习模型以对事件进行分类并找出任何趋势。 这将有助于紧急工作人员对事件进行分类/分类,并将消息发送给适当的救灾机构。 文件描述 有两个jupyter笔记本文件,其中包含成功执行的代码: ETL管道准备>包含用于将最终数据提取/清理/整理/加载到sqlite数据库中的代
  3. 所属分类:其它

  1. Udacity数据工程-源码

  2. 数据工程纳米学位 Udacity在DEND纳米学位中开发的项目和资源。 项目1:关系数据库-使用PostgreSQL进行数据建模。 使用PostgreSQL开发了一个关系数据库,以对音乐流应用程序的用户活动数据进行建模。 技能包括:使用PostgreSQL创建关系数据库使用事实和维度表的优化定义开发星型数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 经验包括:Python,PostgreSql,Star Schema,ETL管道,规范化 项目2:NoSQL数据库
  3. 所属分类:其它

  1. postgres-data-modeling-project:Udacity数据工程纳米学位的第一个项目-源码

  2. Udacity数据工程纳米学位课程 项目:使用Postgres进行数据建模 介绍 一家名为Sparkify的初创公司是一个音乐流应用程序。 他们需要分析他们收集的数据。 数据-json格式的文件,用于记录用户活动和歌曲的元数据。 为了实现此目标,我们创建了一个Postgres数据库和一个ETL管道,该管道使用Python和SQL将文件中的数据传输到该数据库中。 数据库 为了满足Sparkify的分析重点,我们使用星型模式构建数据库。 事实表 'songplays'-来自与歌曲播放相关的日志数据
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:465kb
    • 提供者:weixin_42097668
  1. medium-blog-post:有关中级博客帖子的其他信息-源码

  2. 中博客帖子 有关中等博客文章的其他信息 在Medium上写数据科学博客文章 该项目是Udacity的数据科学纳米学位计划的一部分。 该帖子可以在这里找到: : 介绍 为了写我的帖子,我使用了Kaggle上关于西雅图AirBNB的数据集,: ://www.kaggle.com/airbnb/seattle/data。 目的是通过分析,清理,建模和创建可视化结果来支持以下五个问题,以支持假设并得出结论。 Q1-哪个季节更少/更多可用? 问题2:哪些街区价格更高/更低? 问题3:哪些地区的收视率
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:17mb
    • 提供者:weixin_42116705
  1. mle_udacity:Capstone项目的知识库,用于机器学习工程师Nanodegree-源码

  2. DAX30的股票预测价格 动机 这是来自Udacity的机器学习纳米学位的基本项目报告。 我们专注于预测DAX30公司的股价,DAX30是蓝筹股行销指数,有30家德国主要公司在法兰克福证券交易所交易。 为了提供投资股票的下一个最佳操作,在此项目中,我们比较了3种不同模型和技术的性能。 这些模型是用作基准的ARIMA,Prophet和LSTM NN。 仪表板中使用了最佳模型,以根据用户应输入的某些参数进行预测。 概要 该项目的主要思想是了解给定符号或公司的下一个最佳操作。 要知道下一个最佳操作,
  3. 所属分类:其它

  1. dengnano.project3-源码

  2. 数据工程纳米学位-项目3 云数据仓库 介绍 这是Udacity的数据工程纳米学位计划的第三个项目。 Sparkify是一家提供音乐流应用程序的初创公司。 他们想分析到目前为止收集的数据。 通过分析他们的数据,他们将能够识别简单的事物,例如最常播放的歌曲和最活跃的用户。 通过扩展其数据收集和存储功能,他们可以使用数据分析来建模保留率,经常性收入,甚至预测诸如免费用户是否以及何时转换为付费用户之类的事情。 数据源 Sparkify已经开始从其应用程序收集事件日志,并已将两种形式的日志输出到S3存储
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:123kb
    • 提供者:weixin_42133969
  1. cassandra-data-modeling:Udacity数据工程师Nanodegree-Postgres数据建模-源码

  2. 卡桑德拉数据建模 Udacity数据工程师纳米学位项目 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,没有简单的方法来查询数据以生成结果,因为有关应用程序上用户活动的数据位于CSV文件目录中。 他们希望数据工程师创建一个Apache Cassandra数据库,该数据库可以对歌曲播放数据创建查询以回答问题。 任务是为该分析创建一个Cassandra数据库。 在本地运行的要求 Python3
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:605kb
    • 提供者:weixin_42108054
  1. 数据工程师纳米学位项目Udacity:由Udacity.com在数据工程师纳米学位计划中完成的项目-源码

  2. 数据工程师,纳米学位,项目,Udacity 在完成的项目 课程1:数据建模 数据建模导论 了解数据建模的目的 识别不同类型的数据库和数据存储技术的优缺点 在Postgres和Apache Cassandra中创建表 关系数据模型 了解何时使用关系数据库 了解OLAP和OLTP数据库之间的区别 创建规范化的数据表 实现非规范化模式(例如STAR,Snowflake) NoSQL数据模型 了解何时使用NoSQL数据库以及它们与关系数据库的区别 为给定用例选择适当的主键和聚类列 在Apache Ca
  3. 所属分类:其它

  1. 数据工程纳米学位:Udacity.com在数据工程纳米学位中完成的项目-源码

  2. 数据工程纳米学位 在完成的项目 课程1:数据建模 数据建模导论 ➔了解数据建模的目的 ify确定不同类型的数据库和数据存储技术的优缺点 in在Postgres和Apache Cassandra中创建一个表 关系数据模型 ➔了解何时使用关系数据库 ➔了解OLAP和OLTP数据库之间的区别 ➔创建标准化数据表 ➔实现非规范化模式(例如STAR,Snowflake) NoSQL数据模型 ➔了解何时使用NoSQL数据库以及它们与关系数据库的区别 for为给定用例选择适当的主键和聚类列 in在Apache
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:19mb
    • 提供者:weixin_42126399
  1. Udacity-Data-Engineering-Projects:与数据工程相关的项目很少,包括数据建模,云上的基础设施设置,数据仓库和数据湖开发-源码

  2. 数据工程项目 项目1:使用Postgres进行数据建模 在这个项目中,我们将数据建模与Postgres结合使用,并使用Python构建ETL管道。 一家初创企业希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 当前,他们正在以json格式收集数据,分析团队对了解用户正在收听的歌曲特别感兴趣。 链接: 项目2:使用Cassandra进行数据建模 在这个项目中,我们将Data Modeling与Cassandra结合使用,并使用Python构建ETL管道。 我们将围绕要获取答案的
  3. 所属分类:其它

« 12 »