您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Web Data Mining (英文)

  2. 目录回到顶部↑ 第一部分 数据挖掘基础. 第1章 概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章 关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
  3. 所属分类:专业指导

    • 发布日期:2012-05-02
    • 文件大小:8mb
    • 提供者:chen_767
  1. 2013年大数据技术峰会PPT(34篇)完整版

  2. 2013年大数据技术峰会PPT(34篇)完整版猛料上传。 资料包含了“大数据架构与系统”、“大数据技术”、“大数据应用”、“大数据的研发趋势”,“大数据基准测试(Benchmark)”,以及“智能交通与大数据” 六个分论坛及行业峰会。拟邀请近百位国内外顶级的大数据学术界专家和业界技术领袖坐而论道,内容涵盖数据获取与清 理、传输、存储、计算、挖掘、展现、开发平台与应用市场等方面,覆盖了数据生产的全生命周期。除了Hadoop 版本2.0系统YARN,以及Spark等新型系统架构介绍外,还将探讨流式
  3. 所属分类:其它

    • 发布日期:2013-12-16
    • 文件大小:56mb
    • 提供者:kingalong
  1. 数据流聚类文章

  2. 近年来,数据采集技术以及数据挖掘技术不断发展,通常在短时间内就 可以采集到大量的数据,并加以分析处理。随着信息技术以及 Web 技术的飞 速发展,数据不再是存储于可多次随机访问的介质中的静态数据,而是称之 为数据流的动态流式数据。不同于静态数据,数据流具有实时性、连续性、 顺序性等特性,因而传统的聚类分析技术无法直接应用于数据流,需要新的 聚类分析技术来处理数据流。本文针对数据流聚类技术从多个方面进行了深 入细致地研究。
  3. 所属分类:其它

    • 发布日期:2014-12-16
    • 文件大小:291kb
    • 提供者:u012759692
  1. 大数据日知录(1/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:50mb
    • 提供者:thirdlucky
  1. 大数据日知录(2/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:17mb
    • 提供者:thirdlucky
  1. 大数据方案介绍_技术

  2. 大数据 技术平台 方案。 --- Hadoop是架构在廉价的硬件服务器上,不需要非常昂贵的硬件做支撑。2、 开源的产品,免费的,基于开源协议,可以自由修改,可控性更大。3、因为属于二次开发,同时因为有非常活跃的社区讨论,对开发人员的能力要求相对不高,工程师的学习成本也并不高。4、当集群规模非常大时,开发成本和维护成本会凸显出来。但是相对于自研系统来说的话,还是便宜的很多。 hadoop的整个生态体系,涵盖了系统数据存储、数据收集、数据导入导出到关系数据库、并行计算框架、数据序列化处理与任务调度
  3. 所属分类:Hadoop

    • 发布日期:2017-09-25
    • 文件大小:1mb
    • 提供者:wfeng007
  1. 大数据-日知录-架构-算法(PDF高清完整版)

  2. 内容简介 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件 体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-23
    • 文件大小:67mb
    • 提供者:sbliu_rsgs
  1. 大数据实战手册

  2. 本资源适合大数据入门人群,包括hadoop环境搭建,详细介绍hdfs、mapreduce等核心组件以及流式计算解决方案storm、数据挖掘方面的知识
  3. 所属分类:Hadoop

    • 发布日期:2017-12-06
    • 文件大小:2mb
    • 提供者:tonny1420
  1. 大数据日知录——架构与算法

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:算法与数据结构

    • 发布日期:2018-04-12
    • 文件大小:67mb
    • 提供者:yh3000
  1. 大数据工程师篇2017

  2. 大数据工程师篇2017介绍包括:流式计算、日志收集、编程语言、数据分析挖掘、数据搜索/可视化、机器学习、算法、云计算、大数据通用处理平台、分布式协调、分布式存储、存储格式、数据库、资源调度、工作流调度、机器学习工具、数据安全、部署工具、数据分析/数据仓库(SQL类)、消息队列。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-04-27
    • 文件大小:2mb
    • 提供者:w_h_zhang
  1. spark流式计算处理

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎,Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2018-08-23
    • 文件大小:66byte
    • 提供者:qq_34744424
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. 三种NI的数据记录软件技术白皮书.pdf

  2. 三种NI的数据记录软件技术白皮书pdf,常见的数据采集应用是将采集的数据简单地记录到磁盘或数据库,以进行进一步的分析。本文介绍了能够配合NI DAQ设备使用的三种数据记录软件-LabVIEW SignalExpress LE、LabVIEW SignalExpress以及LabVIEW。许多简单的数据记录仪都只能采集基本的信号。 针对这种情况进行了功能扩 展,囊括了超 种高级信号处理和数据分析功能。您可以借助 使用功率 谱和频率响应 步骤,进行频域分析;对信号失真进行测量,如分析,和 等 应用低
  3. 所属分类:其它

    • 发布日期:2019-10-31
    • 文件大小:284kb
    • 提供者:weixin_38744375
  1. 基于流式计算的电信实时营销系统设计与实现.caj

  2. 在移动互联网时代,各式各样的新业务和新产品不断出现,通信市场的用户总体规模增长速度变缓,使运营商之间的竞争愈加激烈,新产品营销的时效性和准确度问题亟需解决。实时营销作为新的营销方式,具有较高的实时性,通过运用大数据分析技术分析用户上网行为特征,并在合适的时间、合适的地点向用户推荐合适的内容,从而提升用户感知、增加用户粘性。如何运用大数据技术实现实时营销是本文的重要内容。本文深入调研分析了大数据实时流式处理技术,并结合其在满足非功能性需求方面的独特优势,设计了一个可以同时满足大数据存储、大数据实时
  3. 所属分类:spark

  1. 百度数据工厂在流式数据处理的应用与实践

  2. 百度数据工厂整合了各种解决方案,目的就是提供一个一站式的数据处理平台。 百度数据工厂最原先用 Hive 引擎,进行离线批量数据分析和 PB 级别的查询,处理一些核心报表数据。但是在推广过程中发现,用户其实还是有复杂分析、实时处理、数据挖掘的请求,现在则以 Spark 为基础做了统一的一个计算引擎,以前 Hive 的一套也完全融入到 Spark 里来;包括多种提交方式;安全管理等等。最后形成一套完整的成品。
  3. 所属分类:spark

    • 发布日期:2019-06-30
    • 文件大小:718kb
    • 提供者:longlongriver
  1. 流式机器学习与数据挖掘

  2. 流式机器学习与数据挖掘,了解更多的数据挖掘与机器学习使用背景
  3. 所属分类:深度学习

    • 发布日期:2019-03-08
    • 文件大小:931kb
    • 提供者:dangyj14
  1. 具有人类记忆特性的集成式数据流挖掘模型与算法

  2. 具有人类记忆特性的集成式数据流挖掘模型与算法
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:629kb
    • 提供者:weixin_38579899
  1. Spark-Streaming流式数据处理

  2. 目前为止,已经讨论了机器学习和批处理模式的数据挖掘。现在审视持续处理流数据,实时检测其中的事实和模式,好像从湖泊来到了河流。先研究一下不断改变的动态环境带来的挑战,在列出流处理应用的先决条件(如,与Twitter的TCPSockets)之后,结合Spark,KafkaandFlume把数据放入一个低延迟,高吞吐量,可缩放的处理流水线。要点如下:按照惯例,先看一下最初的数据密集型应用架构,指明我们所感兴趣的SparkStreaming模块的所处位置.下图着重指明了整体架构中的SparkStream
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:769kb
    • 提供者:weixin_38717143
  1. Spark-Streaming流式数据处理

  2. 目前为止,已经讨论了机器学习和批处理模式的数据挖掘。现在审视持续处理流数据,实时检测其中的事实和模式,好像从湖泊来到了河流。先研究一下不断改变的动态环境带来的挑战,在列出流处理应用的先决条件(如,与Twitter的TCPSockets)之后,结合Spark,KafkaandFlume把数据放入一个低延迟,高吞吐量,可缩放的处理流水线。要点如下:按照惯例,先看一下最初的数据密集型应用架构,指明我们所感兴趣的SparkStreaming模块的所处位置.下图着重指明了整体架构中的SparkStream
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:742kb
    • 提供者:weixin_38729399
  1. 一种流数据立方体分析挖掘框架

  2. 流数据是目前一种重要的数据展现形式,对流数据进行OLAM(联机分析挖掘)操作可为分析人员提供多层次的数据视图。但OLAM要求在不同粒度中实现对数据的聚合操作,而流式数据内含时态特性和持续到达特性,使得数据无法被多次重复操作。使用传统OLAP(联机分析处理)方法无法生成部分物化视图且流数据规模宏大,受限于存储空间大小而无法保存全部数据单元信息。针对上述问题,提出了一种基于概要技术的流数据OLAM 框架——sketch cube(概要立方体),该框架把任意维度组合映射成唯一自然数,根据上下限单调原则
  3. 所属分类:其它

« 12 3 »