您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 流数据处理技术介绍(亚信_田毅).pdf

  2. 该文档比较系统的介绍了流处理产生背景,常用技术,应用场景。Storm、Spark Streaming 、IBM Stream等。
  3. 所属分类:群集服务

    • 发布日期:2014-12-04
    • 文件大小:5mb
    • 提供者:u012106902
  1. Java机器学习.pdf

  2. 机器学习是人工智能的一个分支,它在算法与数据的协助下,让计算机像人类一样学习和行 动。针对给定的数据集,机器学习算法会学习数据的不同属性,并对以后可能遇到的数据属性进 行推断。 本书教你如何使用Java创建并实现机器学习算法,既有基础概念的讲解,也有示例供你学习。 当然,还会介绍一些常用的机器学习库,如Weka、 Apache Mahout、 Mallet等。阅读本书后,你 将懂得如何为特定问题选择合适的机器学习方法,以及如何比较与评估不同技术的优劣。书中还 会讲解性能提升技术,包括输入预处理
  3. 所属分类:Java

    • 发布日期:2019-07-15
    • 文件大小:5mb
    • 提供者:qq_35409106
  1. 中国大数据发展调查报告(2015年).pdf

  2. 中国大数据发展调查报告(2015年).pdf中国大数据发展调查报告(2015年) CAcT中国體盒听 刊言 2014年是中国企业级大数据市场的起步之年,经过近两年的探 索与准备,国内一些电信和金融等行业用户开始实际部署大数据平台 与应用,带动软件、硬件和服务市场发展。为进一步掌握中国企业大 数据的应用状况和特点,中国信息通信研究院开展了2014年中国大 数据应用状况的调查。本次活动采用在线间卷的方式,对中国大数据 市场规模、应用状况、数据资源情况、平台建设情况、企业大数据应 用的政策和资源需求等
  3. 所属分类:互联网

    • 发布日期:2019-07-03
    • 文件大小:1mb
    • 提供者:qq_34543438
  1. Spark产生的背景

  2. 大数据时代: 数据量大 数据种类繁多 数据增长速度快 大数据不同层面及技术: 大数据关键技术: 分布式存储 GFS/HDFS BigTable/HBase NoSQL(键值、列族、图形、文档数据库) NewSQL(如 : SQL Azure ) 分布式处理框架: Hadoop Storm Flink Spark hadoop: hadoop是Apache软件基金会旗下的一个开源式计算平台为用户提供了系统底层细节透明的分布式基础架构 Hadoop是java编写的开源、可伸缩和容错的框架,并且可部
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:94kb
    • 提供者:weixin_38720322
  1. Data_Science_Portfolio:在学术界和自我学习中均已完成的数据科学组合-源码

  2. 数据科学组合 该产品组合包含以学术界和自学方式完成的数据科学领域的各种项目。 组织 1.机器学习 :数据分析和机器学习解决了电信客户流失。 :线性回归教程,从零开始实施numpy / pandas与scikit-learn进行比较,以预测客户可以出售其房屋的最佳价格。 :预测签名是由希格斯玻色子(信号)还是其他过程(背景)产生的。 仅使用Numpy从头开始实现所有ML模型。 :使用传统的机器学习技术对tweet进行正/负情感分析。 2.深度学习 :使用协作采样方案可提高深度生成对抗网络中
  3. 所属分类:其它

  1. SparkStreaming源码解读之数据清理内幕彻底解密

  2. 1.理清楚SparkStreaming中数据清理的流程a)背景b)如何研究SparkStreaming数据清理?c)源码解析SparkStreaming数据清理的工作无论是在实际开发中,还是自己动手实践中都是会面临的,Spark Streaming中BatchDurations中会不断的产生RDD,这样会不断的有内存对象生成,其中包含元数据和数据本身。由此Spark Streaming本身会有一套产生元数据以及数据的清理机制。操作DStrea
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:107kb
    • 提供者:weixin_38612909