您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据流挖掘中的聚类算法综述

  2. 摘 要: 近期,随着诸如实时监控系统、网络入侵检测和web上用户点击流等动态的应用环境源源不断地产生海量的、时序的、快速变化的和潜在无限的数据流,对数据流挖掘的研究变得重要而富有意义。聚类分析作为数据流挖掘领域的一个重要问题,在近期被高度重视和广泛研究。由于数据流模型不同于传统数据集的特殊性质,新的要求和挑战应运而生。本文对数据流挖掘中各种聚类分析算法和处理框架做了综述。文章力图回顾数据流聚类分析领域的最近发展水平,提供给读者该领域的一个清晰的蓝图。为了实现这个目标,我们将首先介绍数据流聚类的
  3. 所属分类:其它

    • 发布日期:2009-07-02
    • 文件大小:751kb
    • 提供者:aonu
  1. 多层自动确定类别的谱聚类算法

  2. 自动确定聚类数和海量数据的处理是谱聚类的关键问题。在自动确定聚类数谱聚类算法的基础上,提出了一种能处理大规模数据集的多层算法。
  3. 所属分类:互联网

  1. 聚类算法综述

  2. 随着互联网以及移动终端网络的广泛普及与兴起,互联网进入了云计算时代,然而海量数据的处理离不开对数据的分析以及有价值信息的提取,本文就是有关数据挖掘领域的一篇综述性论文,文中对当前存在的几乎所有的聚类算法进行简要或详细的阐述,内容丰实,对入门以及研究具有很大的帮助!
  3. 所属分类:数据库

    • 发布日期:2011-12-16
    • 文件大小:1mb
    • 提供者:hbsilence
  1. 聚类在Web分析中的应用

  2. 在大数据时代,有人估计个人电脑里存储的信息平均价值为30万美元,信息资源已经成为衡量一个企业、一个团体、一个社会进步的重要因素。大数据,方方面面影响着人们的日常生活,决定着企业的盈亏。在科学研究领域,大数据时代突破传统的推理、实验、仿真三范式,带来了科技创新的第四范式---大数据分析。在如此海量的数据爆发的背景下,网页数据也与日俱增。如何对网页数据进行深入挖掘也成为人们日益关注的问题。本文使用聚类分析方法对Web新闻内容进行聚类,得到了属于同一类的新闻,在实验的基础上,我们得到了高关注度的新闻
  3. 所属分类:数据库

    • 发布日期:2014-03-26
    • 文件大小:936kb
    • 提供者:luolailong
  1. 基于storm海量数据的实时聚类

  2. storm整体框架说明,并对如何使用聚类算做详细解释
  3. 所属分类:Java

    • 发布日期:2015-06-18
    • 文件大小:610kb
    • 提供者:alafate123
  1. 移动对象的时空轨迹聚类算法研究_何苗

  2. 随着科技的不断进步,人们对移动对象的实时位置的获取越来越便捷。这些 移动对象在一段时间内的实时位置就构成了该对象的一条时空轨迹。技术的 进步和设备的不断小型化使得定位设备的应用越来越普遍。因此,在人们的各种 生产活动中产生的时空轨迹也越来越多,呈爆炸性趋势。从这些海量的轨迹数据 中挖掘出有用信息非人力所能及。聚类算法作为数据挖掘领域的一种重要方法, 越来越多的被研究人员应用到时空轨迹数据的挖掘中。
  3. 所属分类:其它

    • 发布日期:2015-11-12
    • 文件大小:6mb
    • 提供者:u014524078
  1. 大数据挖掘技术与应用

  2. 本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并行聚类算法、基于密度加权的模糊聚类算法、高唯复杂数据聚类算法、基于数据场的聚类算法、基于距离的量化关联规则和基于数据场的量化关联规则算法,给出了在矿产资源评价、遥感图像分类、矿业经济分析中的应用例证。全书共分11章,主要内容包括:绪论,基于密度和密度可达聚类分析,基于簇特征的动态增量聚类分析,并行聚类分析
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-08
    • 文件大小:108mb
    • 提供者:q1457797371
  1. 多维数据集中高维数据可视化算法研究

  2. 多维数据集中包含海量的复杂高维数据,如何对这些数据进行科学的理解、分析和使用,是数据挖掘领域的一个重点和难点课题.针对传统可视化算法无法解决高维数据多属性的可视化问题,算法复杂、适用性较差的不足,提出基于快速数据聚类的可视化算法研究.算法构建了一种多维数据模型,采用三角多项式建立映射关系;对多维数据集做不同层次的划分,并基于聚类的效果筛选最佳聚类数;最后在平行坐标系基础上,对高维数据进行时序多维分析,提高算法鲁棒性.实验证明提出算法简洁易用,能够较好地实现对多维数据集中高维数据的理解和分析.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:261kb
    • 提供者:qq_28339273
  1. 一种基于海量高维数据的软子空间聚类改进算法

  2. 基于加权的软子空间聚类是处理高维数据的一种有效手段,在原有的软子空间聚类算法基础上对目标函数进行改进,从而结出一种新的软子空间聚类算法.相较之原算法,此算法具有更高的抗噪性及聚类效率;通过与典型的软子空间聚类算法比较试验,结果表明可有效提高海量高维数据的聚类处理效率.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-16
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 基于改进K-means聚类算法的负荷建模

  2. 基于改进K-means聚类算法的负荷建模,蒋国栋,白雪峰,负荷模型对电力系统仿真计算的准确性有重要影响。负荷建模数据应取自电网实际运行数据,所以必须从海量运行数据中提取能够代表节
  3. 所属分类:其它

    • 发布日期:2020-01-18
    • 文件大小:290kb
    • 提供者:weixin_38543460
  1. 海量用电数据并行聚类分析

  2. 针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means两种典型的聚类算法,提出一种新的聚类思路,使用Canopy先对用电数据进行粗略处理,得到聚类个数和聚类中心,再用K-means精确聚类,既利用了K-means算法简单、收敛速度快的优势,又使其不容易陷入局部最优.为达到处理海量数据的目的,把提出的算法部署到MapReduce框架上进行实验.研究结果表明:提出的算法在海量用电数据的处理方面高效可行,并且具有良好的加
  3. 所属分类:其它

    • 发布日期:2020-06-28
    • 文件大小:572kb
    • 提供者:weixin_38547409
  1. 基于云平台的层次聚类算法在煤炭产业中的应用

  2. 层次聚类(Hierarchical Clustering)就是通过对数据集按照某种方法进行层次分解。该聚类方法可以设定聚类的个数,并得到了各个研究和应用领域的广泛应用。煤炭产业中往往希望对煤炭的产品进行聚类分析,从而有助于开发和生产。随着煤炭系统中收集的煤炭数据数量的增多,层次聚类算法由于需要计算大量的相似性矩阵需要大量的内存,原有的层次聚类算法不能有效地处理海量规模数据。文章针对煤炭数据中生成的大规模数据,提出基于云计算平台的分布式层次聚类算法,该算法能够分布式完成相似性矩阵的保存和计算,快速
  3. 所属分类:其它

    • 发布日期:2020-07-06
    • 文件大小:582kb
    • 提供者:weixin_38614391
  1. 基于高维数据聚类的制造过程数据分析平台

  2. 随着制造业领域工艺技术的不断进步,大量感知设备如同人体器官一样,被部署到制造过程中的各个重要节点,产生着海量制造过程数据。针对这些海量制造过程数据,制造业领域越来越需要科学、敏捷、高效的数据分析平台,为制造过程数据的分析提供智力支持和决策支持。针对这种需求,文章采用高维数据聚类技术结合Spring、Mybatis等成熟的敏捷开发框架,开发了制造过程数据分析平台。该设计不仅可以针对历史数据进行分析,还可以实时监控生产线上的动态流程数据,提高数据分析和决策效率。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:231kb
    • 提供者:weixin_38526751
  1. 基于Hadoop的物流历史数据聚类挖掘研究

  2. 数据不仅是一种资源,更是一种财富。在大数据应用领域中,金融数据分析被视为一个很有前景的方向。股票分析一直是金融领域一个很热门的话题,而且涉及多个领域的知识。在此之前,人们更多的是采用基本分析,即通过宏观及微观的经济政策、本行业领域的发展状况、投资者的行为态度、反映企业自身发展状况的指标等方面来预测股票今后走势。随着大数据相关技术的发展,在海量的股票历史数据中发现规律进而预测股票走势成为一个很热门的研究课题。本文是对股票大数据进行聚类分析,本文的主要工作如下:1、数据收集。通过python爬虫以及
  3. 所属分类:交通

    • 发布日期:2020-12-01
    • 文件大小:3mb
    • 提供者:kamo54
  1. Python实现Kmeans聚类算法

  2. 本节内容:本节内容是根据上学期所上的模式识别课程的作业整理而来,第一道题目是Kmeans聚类算法,数据集是Iris(鸢尾花的数据集),分类数k是3,数据维数是4。 关于聚类     聚类算法是这样的一种算法:给定样本数据Sample,要求将样本Sample中相似的数据聚到一类。有了这个认识之后,就应该了解了聚类算法要干什么了吧。说白了,就是归类。     首先,我们需要考虑的是,如何衡量数据之间的相似程度?比如说,有一群说不同语言的人,我们一般是根据他们的方言来聚类的(当然,你也可以指定以身
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:93kb
    • 提供者:weixin_38675746
  1. 海量小数据分布式聚类优化与负载均衡算法

  2. 海量小数据分布式聚类优化与负载均衡算法
  3. 所属分类:其它

  1. 基于位置信息熵的局部敏感哈希聚类方法

  2. 在分析海量生物序列时,现有的聚类算法存在着时间效率不高、 准确率较低,以及聚类结果的生物意义不足等问题。针对这些问题,提出一种基于位置信息熵的局部敏感哈希聚类方法。通过对生物序列使用 K 词计算其标准熵,将标准熵作为局部敏感哈希函数簇的特征向量,计算特征矩阵并应用于生物序列聚类。实验结果表明,该算法能够有效地提高时间效率和聚类的准确率。随着数据集的增大,也同样取得很好的效果,实验结果更具有生物解释性和实际意义。
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:919kb
    • 提供者:weixin_38597970
  1. 基于聚类的电信客户细分

  2. 电信行业是典型的数据密集型行业,拥有大量的甚至是海量的客户数据资源.对电信行业客户消费数据进行深入挖掘可以为企业的资源优化配置和客户关系管理提供理论支持和技术保障.以电信行业的客户消费数据为基本研究对象,在衍生特征构造、样本调整以及特征选择等数据预处理的基础上,本文采用可处理混合数据且具有近似线性时间复杂度的一趟聚类算法建立电信行业的客户细分模型.经实证研究表明,该模型可以将电信的客户有效划分成四个具有不同忠诚程度和消费能力的客户群体,同时从各客户群的消费行为中还可以有效地分析出他们的消费偏向和
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:256kb
    • 提供者:weixin_38623919
  1. 基于Spark的支持隐私保护的聚类算法

  2. 针对经典聚类方法无法应对任意背景知识下恶意攻击者在海量数据挖掘过程中的恶意攻击问题,结合差分隐私保护机制,提出一种适用于Spark内存计算框架下满足差分隐私保护的聚类算法,并从理论上证明了改进算法满足在Spark并行计算框架下的ε-差分隐私。实验结果表明,改进算法在保证聚类结果可用性前提下,具有良好的隐私保护性和满意的运行效率,在海量数据聚类分析的隐私保护挖掘中,具有很好的应用前景和价值。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:500kb
    • 提供者:weixin_38590685
  1. 生物效应大数据评估聚类算法的并行优化

  2. 生物效应评估通过测定和分析生物制剂刺激各种人体细胞后的数字化转录组反应,能够快速确定相关的检测标识物和治疗靶标。基于潜在生物制剂作用下的细胞反应大数据,推测突发生物效应模式。综合考虑了MPI、OpenMP两级并行加速,移植优化了基因探针富集分析(GSEA)比对算法和聚类算法,使用不同的数据量和并行度验证了优化后算法潜在的良好可扩展性和快速处理海量生物信息数据的能力。
  3. 所属分类:其它

« 12 3 4 »