您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据流挖掘中的聚类算法综述

  2. 摘 要: 近期,随着诸如实时监控系统、网络入侵检测和web上用户点击流等动态的应用环境源源不断地产生海量的、时序的、快速变化的和潜在无限的数据流,对数据流挖掘的研究变得重要而富有意义。聚类分析作为数据流挖掘领域的一个重要问题,在近期被高度重视和广泛研究。由于数据流模型不同于传统数据集的特殊性质,新的要求和挑战应运而生。本文对数据流挖掘中各种聚类分析算法和处理框架做了综述。文章力图回顾数据流聚类分析领域的最近发展水平,提供给读者该领域的一个清晰的蓝图。为了实现这个目标,我们将首先介绍数据流聚类的
  3. 所属分类:其它

    • 发布日期:2009-07-02
    • 文件大小:751kb
    • 提供者:aonu
  1. 常用聚类算法原文(DBSCAN等)

  2. 数据挖掘 聚类算法 原文:包括DBSCAN,变色龙算法,BIRCH层次聚类,COBWEB概念聚类,DENCLUDE密度聚类,STING网格聚类,还有离群点算法!
  3. 所属分类:其它

    • 发布日期:2009-11-01
    • 文件大小:10mb
    • 提供者:dnnyyq
  1. ID3算法,SG-1算法,概念聚类算法合集(c语言版)

  2. 包含ID3算法,SG-1算法,概念聚类算法 全部用c语言编写,文件类型为pdf
  3. 所属分类:其它

    • 发布日期:2010-11-30
    • 文件大小:67kb
    • 提供者:zhangyouxinboy
  1. 数据挖掘id3算法、SG-1算法和概念聚类算法

  2. 数据挖掘id3算法、SG-1算法和概念聚类算法 c语言版本 pdf文档
  3. 所属分类:其它

    • 发布日期:2010-12-05
    • 文件大小:67kb
    • 提供者:xuufeii
  1. 近邻传播聚类算法

  2. 文中详细地对近邻传播聚类算法的基本理论概念进行了阐释,并通过案例予以验证。
  3. 所属分类:教育

    • 发布日期:2014-04-07
    • 文件大小:21mb
    • 提供者:hndzzyg
  1. 聚类分析基础概念

  2. K-Means 基于距离的聚类算法 欧氏距离,曼哈顿距离,闵可夫斯基距离 实现原理 随机选取两个点作为聚类中心 计算每个点到聚类中心的距离,进行聚类 计算每个聚类中点的坐标平均值,找出中心点 重复上述过程,直到聚类中心位置变化很小或很大迭代数 孤立点 聚类评估
  3. 所属分类:讲义

    • 发布日期:2017-12-28
    • 文件大小:1kb
    • 提供者:huayuehenlove
  1. kmeans聚类算法概念及举例分析

  2. 该文档详细地讲述了kmeans聚类算法的概念,以及各个参数,各个参数的属性的详细意思及应用,并且通过及例分析讲述了该算法 的应用。
  3. 所属分类:其它

    • 发布日期:2018-06-28
    • 文件大小:15kb
    • 提供者:qq_27958235
  1. 各种聚类算法介绍及对比

  2. 层次聚类:层次聚类 划分聚类法:Kmeans算法 基于密度的聚类:DBSCAN的概念
  3. 所属分类:机器学习

    • 发布日期:2018-03-02
    • 文件大小:238kb
    • 提供者:ch379612148
  1. 改进的基于概化的概念构成聚类算法

  2. 基于概化的概念构成(Generality-based Concept Formation,GCF)是一种分类数据层次聚类算法,对GCF算法提出2点改进。首先,定义了一种新的基于条件概率分布的相似度度量,并用它替代原算法中的相似度,该度量将分类数据进行数值化处理,更精确地反映了数据间的相似程度。其次,提出相似度品质概念,给出了计算公式,相似度品质可与原算法中样本变异系数配合使用,共同确定概化水平。改进算法提高了聚类准确率,同时算法的时间复杂性保持不变。
  3. 所属分类:其它

    • 发布日期:2020-05-17
    • 文件大小:184kb
    • 提供者:weixin_38674512
  1. 基于改进谱聚类算法的电压断相识别

  2. 针对传统谱聚类中使用高斯相似函数作为聚类相似性度量的存在的弊端,提出了利用共享自然邻概念的自适应相似度量替代高斯相似函数,结合电压电流数据间内在的联系,将相似度重新定义。实验结果表明,基于自然邻的谱聚类在识别电压断相上,具有一定程度的有效性和优越性。
  3. 所属分类:其它

  1. Python基于聚类算法实现密度聚类(DBSCAN)计算【测试可用】

  2. 主要介绍了Python基于聚类算法实现密度聚类(DBSCAN)计算,结合实例形式分析了聚类算法的相关概念、原理及使用聚类算法进行密度聚类计算的相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-19
    • 文件大小:84kb
    • 提供者:weixin_38631042
  1. Python实现的KMeans聚类算法实例分析

  2. 主要介绍了Python实现的KMeans聚类算法,结合实例形式较为详细的分析了KMeans聚类算法概念、原理、定义及使用相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-19
    • 文件大小:210kb
    • 提供者:weixin_38621897
  1. 机器学习入门 — K-means、DBSCAN聚类算法(概念、图解、代码示例)

  2. 聚类概念 聚类是把相似的东西分到一组,它是一个无监督问题,没有标签使用 难点: 对于有标签的有监督学习问题,标签可以便于我们来评估模型,无监督学习问题在评估上比较难一点 对于不同的参数组合,得到的学习结果,因为比较难对模型做评估,所以不能通过一个精确度的好坏来选择参数组合 K-MEANS算法 K-MEANS算法是聚类问题中,最简单,也是最实用的一个算法 基本概念 一个数据放进来,需要指定K值,来声明要得到簇的个数 质心:一个簇的数据均值,即向量各维取平均即可(迭代时使用) 距离的度量:常用欧几里
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:438kb
    • 提供者:weixin_38674124
  1. DBSCAN聚类算法简介

  2. DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种典型的基于密度的聚类方法。它将簇定义为密度相连的点的最大集合,能够把具有足够密度的区域划分为簇,并可以在有噪音的空间数据集中发现任意形状的簇。 1. 基本概念 DBSCAN 算法中有两个重要参数:Eps 和 MmPtS。Eps 是定义密度时的邻域半径,MmPts 为定义核心点时的阈值。 在 DBSCAN 算法中将数据点分为以下 3 类。 1)核心点 如
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:155kb
    • 提供者:weixin_38571453
  1. 机器学习入门教程5-使用 Python 和 scikit-learn 学习聚类算法

  2. 在本教程中,您将使用无监督学习来发现数据中的分组和异常点。在无监督学习中,没有用于显示期望结果的真值(ground truth) 或带标签的数据集。而是获取原始数据并使用各种算法来发现数据集群。如果您想了解无监督学习背后的理论和概念,请阅读用于数据分类的无监督学习。 在集群变得明显(例如在 3D 图表中)后,您可能想将标签应用于集群。这就是使用无监督学习来发现数据中的隐藏特征的一个示例。如果您不关心集群,而只想了解有关异常点的更多信息,那么可以考虑使用异常检测。 值得注意的是,当您尝试可视化
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:971kb
    • 提供者:weixin_38687904
  1. 一种适用于模糊聚类算法的有效性指标

  2. 模糊c均值聚类算法是最常见的聚类算法。 它通过定义成员资格矩阵来解决数据的不切实际的本质。 由于模糊c均值聚类算法需要预先设置分类数,这在没有先验数据集的情况下几乎是不可能的,因此一些学者提出了有效性指标的概念。 由于有效性指标与隶属度矩阵,数据集中的数据点和聚类中心之间的距离关系有关,因此希望特征加权方法可以用于评估数据集中数据的所有特征。以获得最佳的分类编号。 因此,本文提出了一种针对综合权重指数,密实度指数和可分离性指数的改进的有效性指数。 该有效性指标首先确定数据点的特征与数据点本身之间
  3. 所属分类:其它

  1. 基于突发词聚类的微博突发事件检测方法

  2. 微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:951kb
    • 提供者:weixin_38610870
  1. 基于谱聚类的离群值检测技术

  2. 离群检测在许多应用领域中显示出越来越高的实用价值,例如入侵检测,欺诈检测,电子商务中犯罪活动的发现等。 已经开发出许多用于离群值检测的技术,包括基于分布的离群值检测算法,基于深度的离群值检测算法,基于距离的离群值检测算法,基于密度的离群值检测算法和基于聚类的离群值检测。 频谱聚类作为近年来出现的竞争性聚类算法备受关注。 但是,它不能很好地扩展到现代大型数据集。 为了部分规避此缺点,在本文中,我们提出了一种受谱聚类启发的新的异常值检测方法。 我们的算法结合了kNN的概念和频谱聚类技术,通过在特征空
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:225kb
    • 提供者:weixin_38749305
  1. 负荷曲线数据中概念漂移的聚类生存模型

  2. 客户的电力消耗模式的准确情景对于电力供应商来说是一项有价值的资产。 本文提出了负荷分布数据中概念漂移的聚类生存模型。 概念漂移的集群生存模型检索集群随时间的动态行为。 我们制定了一种新的数据流聚类算法I-niceStream,该算法自动识别聚类的数量和初始聚类中心,以产生聚类结果。 我们从聚类结果中得出修正的Kullback-Leibler散度,用于计算概念漂移得分。 概念漂移分数用于估计相关的聚类和聚类模式。 生存模型将聚类模式分为持续,衰落和新兴类型。 对从中国广东省不同工厂收集的合成数据集
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:512kb
    • 提供者:weixin_38643407
  1. 基于改进Hausdorff距离的轨迹聚类算法

  2. 以整条轨迹为目标的聚类方法存在轨迹较长的问题。为此,提出一种以轨迹子段为聚类目标的聚类算法CTIHD。给出一种新的轨迹子段距离度量方法,用以消除轨迹子段之间的公共偏差。利用特征点概念将轨迹划分成轨迹子段集,计算轨迹子段之间的相似度,由此实现聚类。实验结果表明,该算法相比同类算法具有更好的轨迹聚类效果。
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 »