您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DataScienceProjects:Python中的数据科学项目-源码

  2. 产品组合:数据科学和BI项目 作者耶夫里·洛佩斯(YefryLópez) 描述 Python中的数据科学和分析项目。 内容 工具箱 SQL Python Numpy Seaborn Matplotlib Pandas PowerBI Scikit-learn Jupyter Lab Tensorflow散景叶 技能专长 数据处理 数据清理 探索性数据分析 数据可视化 静态思维 监督思维 回归 统计思维 项目Python笔记本 商业智能项目 讲解
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:12mb
    • 提供者:weixin_42097369
  1. frictionless-py:无摩擦是描述,提取,验证和转换表格数据的框架-源码

  2. 无摩擦框架 无摩擦 4现已上线! 请阅读 无摩擦是描述,提取,验证和转换表格数据的框架(DEVT框架)。 它支持大量数据方案和格式,并提供流行的平台集成。 该框架由轻量级且全面的无。 目的 描述您的数据:您可以推断,编辑和保存数据表的元数据。 这是确保数据质量和可用性的第一步。 无摩擦元数据包括有关您的数据的一般信息,例如文本说明,以及字段类型和其他表格数据详细信息。 提取数据:您可以使用统一的表格界面读取数据。 模式保证了数据质量和一致性。 Frictionless支持各种文件方案(例如H
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:12mb
    • 提供者:weixin_42128015
  1. Getting-and-Cleaning-Data-Course-Project:获取和清理数据课程项目-源码

  2. 获取和清洗数据课程项目 获取和清理数据课程项目这是“获取和清理数据Coursera”课程的课程项目。 包含的R脚本run_analysis.R执行以下操作:下载数据集,并将该文件放置在“ data”文件夹中(如果该文件在工作目录中尚不存在)。 解压缩文件。 获取文件列表。 分配数据并为变量设置名称。 检查上述变量的属性合并训练和X,y和主题的测试集以创建一个数据集“ data_merged”。 仅将每次测量的均值(均值)和标准差(std)的测量值提取到新的数据集“数据”中。 使用描述性活动名称在
  3. 所属分类:其它

  1. Veeresh_Portfolio:数据科学项目-源码

  2. Veeresh_Portfolio 数据科学项目 建立了用于分类不同类型葡萄酒品牌的神经网络模型。 已调整模型使用各种超参数调整方法来获得最佳精度 建立了一个LSTM模型,如果我们提供输入文本数据,该模型将生成文本输出 建立模型并在Google Colab中训练模型 下载数据,清理数据并应用Count Vectorizer方法 建立了一个ANN模型对文本数据进行分类。 已调整模型使用各种超参数调整方法来获得最佳精度 下载数据,使用Minmax缩放器清理数据并缩放数据 建立LSTM模型并在火
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:483kb
    • 提供者:weixin_42106357
  1. apache-airflow-mini-project:通过Apache Airflow Scheduler安排股票市场财务数据下载作业-源码

  2. apache-airflow-mini-project 通过Apache Airflow Scheduler安排股票市场财务数据下载作业 指导性Capstone项目:日终(EOD)数据加载 客观的: 使用Spark聚合方法执行数据清理。 使用Parquet文件创建Spark DataFrames 使用云存储作为Spark作业的输出 输出
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:235kb
    • 提供者:weixin_42109125
  1. zabbix-orphaned-data-cleanup:Zabbix数据库中孤立数据的清理脚本-源码

  2. Zabbix数据库清理 这个仓库包含一些有用的查询,以清理Zabbix数据库中的旧孤立数据。 尽管Zabbix做客房整理,但它不能很好地清除孤立数据。 特别是如果您来自较长的升级产品线(从1.x到1.6到1.8到2.x),则数据库很可能充满了占用磁盘空间的孤立数据。 用法:检查您有多少个孤立行 这些查询可以安全运行,但是,如果您的数据库很大,请注意,这可能需要一段时间(请阅读:几个小时很正常)。 userhost-$ mysql -f zabbix < checkscr ipt.sql
  3. 所属分类:其它

  1. DataLanding:数据登陆仓库-源码

  2. 清理和解析数据的主页!
  3. 所属分类:其它

  1. tfjs-linear-regression-predictions:来自TensorFlow.js的演示—根据2D数据进行预测-源码

  2. Tensorflow JS线性回归 Tensorflow.js教程使用脚本标记作为加载文件的入口点。 我将通过npm安装并使用Create React App并尝试在可能的地方进行模块化。 我将参考Tensorflow JS上的二维线性回归教程中的代码并对其进行重构: Tensorflow.js允许您在浏览器中运行机器学习模型以进行分析和培训。 在移动设备上,您可以访问来自摄像头,麦克风,加速计等的传感器数据,同时保持用户隐私。 所有使用的数据都保留在客户端。 对于TFJS,增加的用户隐私是
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:671kb
    • 提供者:weixin_42105816
  1. clean-dialog:清理对话框数据的框架-源码

  2. 本项目为一个清洗对话数据的多线程框架,目前还比较简陋,欢迎提bug和优化,索引句重复重复降重函数的正则或者后缀算法。代码还在继续完善中,注释以及一些函数出处引用等待完善。 目录结构 --clean: 清洗框架主目录 ---rules: 存放各级别的规则函数 ---tool_data: 存放黑名单词典,每行一个词 ---run_dist.py: 主运行文件,构造dataloader, 加载黑名单 ---single_filter.py: run_dist.py所调
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:11mb
    • 提供者:weixin_42129300
  1. 飓风频率:探索热带气旋数据可视化的个人数据科学项目-源码

  2. 飓风频率 这是我从事的项目,旨在获得使用Python和Pandas进行数据清理,处理和可视化的经验。 我一生都在美国东南部生活,其中很多年都在佛罗里达州,所以我一直对预测热带气旋以及驱动其发展和行为的因素一直很感兴趣。 该项目包含一个简单的Web抓取工具,清理和整理数据的功能以及几种可视化类型。 该项目使用了的HURDAT2数据集,该档案是最佳跟踪数据的档案数据集,描述了自1851年开始保持一致的记录以来每个热带气旋中心的地理位置。该数据集还包括有关中心范围的信息。飓风中热带风暴和飓风强度的
  3. 所属分类:其它

  1. openclean-core:适用于Python的数据清理和数据分析库-源码

  2. openclean-Python的数据清理 关于 openclean是用于数据分析和数据清理的Python库。 该项目的动机是,数据准备仍然是许多数据科学项目的主要瓶颈。 数据准备需要进行概要分析以了解数据质量问题,并且需要进行数据操作以将数据转换为适合预期目的的形式。 尽管以前已经开发出了许多用于分析和清理数据的不同工具和技术,但是我们看到的这些工具的一个主要问题是缺乏在单个(统一)框架中访问它们的能力。 现有工具可以用不同的编程语言来实现,并且需要大量的精力来安装和接口。 在其他情况下,科
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:40mb
    • 提供者:weixin_42135462
  1. R-渥太华:在国家首都地区使用R-与数据进行交互-源码

  2. 欢迎来到! - 针对在国家首都地区和其他地方学习和使用R感兴趣的人们的页面。 消息: 2021-01-06: 与我们一起参加2月22日在第五届年度数据会议( )内组织的数据工程研讨会。 该研讨会由CBSA主办,将概述与数据工程相关的挑战和解决方案。 您将能够亲身体验一些数据工程挑战,并了解如何使用R和RStudio等现代数据科学工具解决这些挑战。 将介绍开发R软件包和Shiny应用程序以协助数据清理和链接的工作。 详细信息和注册:。 2020-12-10: 在Stats Canad
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:908kb
    • 提供者:weixin_42132598
  1. 数据挖掘项目-源码

  2. 数据挖掘项目 推文聚类 目标: 主Twitter API用于提取推文 掌握自然语言处理 数据清理 推文分类 要求: Twitter开发人员帐户 Twitter API 1-数据提取: 导入库(tweepy +熊猫+ numpy) 连接到Twitter API 将推文提取到多个csv文件中,然后将它们组合到一个csv文件中 2-处理前的推文: 使用re库搜索不必要的信息。 删除标点符号,主题标签,个人资料名称,URL和表情符号。 创建一个新的干净的CSV文件 3-处理推文:自然语言
  3. 所属分类:其它

  1. 数据分析师课程-源码

  2. 完整的数据分析师培训:Python,NumPy,Pandas,数据收集,预处理,数据类型,数据可视化 你会学到什么 本课程提供了成为数据分析师所需的完整准备 用按需的数据技能填写简历:Python编程,NumPy,熊猫,数据准备-数据收集,数据清理,数据预处理,数据可视化; 数据分析,数据分析 全面了解数据分析师的角色 学习初学者和高级Python 学习Python数学 我们将教您NumPy和熊猫,基础知识和进阶知识 能够处理文本文件 了解不同的数据类型及其内存使用情况 了解如何通过简单的脚本
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:539kb
    • 提供者:weixin_42143806
  1. 数据工程师:数据工程练习-源码

  2. 数据工程师 数据工程师做什么? 鉴于其各种技能,数据工程角色可以跨越许多不同的职位描述。 数据工程师可以负责数据库设计,方案设计,创建多个数据库解决方案以及创建管道。 这项工作可能还涉及数据库管理员。 作为数据工程师,您可能充当数据库(或Datalake)与数据科学团队之间的桥梁。 在这种情况下,您还将负责数据清理和准备。 如果涉及大数据,那么为该数据提供有效的解决方案是您的工作。 您还需要进行有效的数据查询以进行报告和分析。 您可能需要与多种类型的数据库进行交互,或者编写存储过程以及数据
  3. 所属分类:其它

  1. TransportationTomorrow:Transportation Tomorrow调查中文件的数据清理脚本-源码

  2. 明天的交通 运输明天调查中文件的数据清理脚本 在我们对清除“运输明天调查”中的文本输出所花费的时间和精力感到沮丧之后,与同事创建了此脚本。 该脚本应使用逗号分隔的格式处理大多数简单的数据提取。
  3. 所属分类:其它

  1. 客户满意度分析-使用因素分析技术:该项目主要专注于数据清理以提高数据清理技能-源码

  2. 巴基斯坦数据清洗 该项目基本上专注于数据清理以提高数据清理技能。 数据集可以在这里找到...
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:183kb
    • 提供者:weixin_42148975
  1. jsonclasses:适用于人工智能的现代声明式数据流框架-源码

  2. JSON类别 适用于人工智能的现代声明式数据流和数据图框架。 JSON类消除了数据清理,数据验证,数据格式转换,数据序列化和数据持久性存储的分离和冗余编码。 JSON类将所有冗余过程转换为在数据类上定义的声明性注释和标记。 就像React.js如何改变前端开发的范式一样,JSON Classes旨在引导行业后端开发标准的转变。 JSON类如何工作? JSON类基于Python数据类构建。 借助Python数据类提供的出色的元编程功能,我们可以轻松地将其扩展为出色的DSL,以声明数据结构
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:123kb
    • 提供者:weixin_42180863
  1. cleanframes:适用于Apache Spark SQL的基于类型的数据清理库-源码

  2. cleanframes:适用于Apache Spark SQL的基于类型的数据清理库
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:29kb
    • 提供者:weixin_42131276
  1. 数据科学:我的所有数据科学实践-源码

  2. 数据科学 我所有的数据科学实践 机器学习算法 数据清理流程 数据挖掘技术 数据库连接--- MySql,PostgresSql 仪表板开发 特征工程与特征选择技术 数据可视化-MatplotLib,Seaborn,Plotly,Bokah 网页抓取
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:15mb
    • 提供者:weixin_42143161
« 12 3 4 5 6 7 8 9 10 ... 50 »