您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于fp树的全局最大频繁项集挖掘算法

  2. 数据挖掘频繁项集是数据挖掘中的重要内容 效率是关键
  3. 所属分类:其它

    • 发布日期:2010-05-05
    • 文件大小:379kb
    • 提供者:suosoujigao
  1. 基于fp_Tree的最大频繁项集挖掘及更新算法

  2. 挖掘频繁项集是多种数据挖掘中的关键问题,该算法不会产生候选项目集
  3. 所属分类:其它

    • 发布日期:2010-05-05
    • 文件大小:438kb
    • 提供者:suosoujigao
  1. 数据挖掘的复习总结( APRIORI算法 ,OLAP操作)

  2. 数据挖掘提纲 1. 数据挖掘的概念:(商业及学术方面) 2. 数据挖掘的模式 3. OLAP技术,多维数据模型,数据立方体概念,构建星型数据库模型 4. 度量分类与计算 5. K均值分配方法 6. OLAP操作有哪些 7. 数据预处理(最小-最大规范化和小数定标规范化) 8. 知识度与精确度的概念 9. T权值与D权值计算 10. 目标类与对比类(得到一些最终的描述) 11. APRIORI算法(用apriori算法找出频繁项集) 12. 由关联挖掘到相关分析,强关联规则未必有趣,通过例子进行
  3. 所属分类:专业指导

    • 发布日期:2011-06-16
    • 文件大小:1mb
    • 提供者:sl198811
  1. fpmax算法的论文

  2. 描述fpmax最大频繁项集挖掘的权威论文,可以看一下实现方法,全英文
  3. 所属分类:数据库

    • 发布日期:2011-09-18
    • 文件大小:326kb
    • 提供者:answerjiang
  1. Apriori算法_数据挖掘技术的研究

  2. Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。核心是基于两阶段频集思想的递推算法。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递推的方法。可能
  3. 所属分类:C#

    • 发布日期:2012-02-14
    • 文件大小:18kb
    • 提供者:lhy2199
  1. fpmming频繁项集挖掘 最大频繁项集挖掘

  2. 频繁项集挖掘 最大频繁项集挖掘 fp-growth fpmax 自己实现的源码还有测试用例
  3. 所属分类:Java

    • 发布日期:2012-04-13
    • 文件大小:64kb
    • 提供者:answerjiang
  1. fpmax*源代码 c语言实现

  2. 最大频繁项集挖掘算法fpmax*,也包含闭项集和频繁项集挖掘的代码
  3. 所属分类:C

    • 发布日期:2013-01-18
    • 文件大小:21kb
    • 提供者:wu19641113
  1. 关联规则挖掘经典算法apriori标准代码实现

  2. Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。 该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,
  3. 所属分类:Python

    • 发布日期:2014-05-05
    • 文件大小:434kb
    • 提供者:loveit111
  1. C++实现Apriori算法,频繁模式数据挖掘,最大频繁项集,闭频繁项集

  2. C++实现Apriori算法,频繁模式数据挖掘,最大频繁项集,闭频繁项集,里面包括测试数据以及apriori.cpp、 apriori.h 、apriori_test.cpp三个文件。具体的相见博客:http://blog.csdn.net/FreeApe/article/details/49562315
  3. 所属分类:C++

    • 发布日期:2015-11-01
    • 文件大小:5kb
    • 提供者:freeape
  1. 数据挖掘18大算法实现以及其他相关经典DM算法

  2. 数据挖掘算法 算法目录 18大DM算法 包名 目录名 算法名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法 AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法 BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法 Classification DataMining_CART CART-分类回归树算法 Classifica
  3. 所属分类:专业指导

    • 发布日期:2016-01-05
    • 文件大小:220kb
    • 提供者:huangyueranbbc
  1. 本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。

  2. 本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。
  3. 所属分类:数据库

    • 发布日期:2017-03-17
    • 文件大小:212kb
    • 提供者:miagaga
  1. 数据挖掘18大算法实现以及其他相关经典DM算法

  2. 数据挖掘算法 算法目录 18大DM算法 包名 目录名 算法名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法 AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法 BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法 Classification DataMining_CART CART-分类回归树算法 Classifica
  3. 所属分类:Java

    • 发布日期:2017-04-08
    • 文件大小:220kb
    • 提供者:q6115759
  1. 基于Spark的并行频繁模式挖掘算法

  2. 在大数据环境下Apriori频繁模式挖掘算法在数据处理过程具有预先设定最小阈值、时间复杂度高等缺陷,为此采用多阶段挖掘策略实现并行化频繁模式挖掘算法PTFP-Apriori。首先将预处理数据以模式树的形式存储,通过最为频繁的k个模式得到最优阈值。然后根据该值删除预期不能成长为频繁的模式以降低计算规模,并利用弹性分布式数据集RDD完成统计项集支持度计数、候选项集生成的工作。实验分析表明相比于传统的频繁模式挖掘算法,该算法具有更高的效率以及可扩展性。
  3. 所属分类:spark

    • 发布日期:2018-06-22
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 基于AFOPT-tree的最大频繁项集挖掘

  2. 1993年AGRAWAL R等人提出了一个重要的反映大规模数据中项目集之间有趣的关联或相关联系的研究课题[1],找出属性间有价值的关系,即关联规则的研究。频繁项集的挖掘是获取关联规则不可或缺的步骤。但挖掘频繁项集时需要考虑太多的候选项集。最大频繁项集中已经隐含了所有的频繁项集,并且在许多数据挖掘应用中也只需要挖掘最大频繁项集,而不是获取所有的频繁项集,因此对最大频繁项集的挖掘具有重大的现实意义。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:151kb
    • 提供者:weixin_38538381
  1. 基于AFOPT-tree的最大频繁项集挖掘

  2. 在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映射至一种压缩的AFOPT-tree结构,该结构结合自顶向下的遍历策略,具有更小的时间开销。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:293kb
    • 提供者:weixin_38682953
  1. 数据挖掘之关联规则分析简介

  2. 关联分析是指从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。在大数据时代,关联分析是最常见的数据挖掘任务之一。 概述 关联分析是一种简单、实用的分析技术,是指发现存在于大量数据集中的关联性或相关性,从而描述一个事物中某些属性同时岀现的规律和模式。 关联分析可从大量数据中发现事物、特征或者数据之间的,频繁出现的相互依赖关系和关联关系。这些关联并不总是事先知道的,而是通过数据集中数据的关联分析获得的。 关联分析对商业决策具有重要的价值,常用于实体商店或电商的跨品类
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:76kb
    • 提供者:weixin_38630853
  1. 分布式数据库全局最大频繁项集增量更新算法

  2. 随着分布式数据库记录的不断增加,需要对已挖掘出的全局最大频繁项集进行增量更新。在已经提出的快速挖掘全局最大频繁项集算法(FMMFI)的基础上,提出了分布式数据库全局最大频繁项集增量更新算法(IUGMFI)。IUGMFI算法利用了FMMFI算法已经挖掘出的分布式数据库全局频繁项目和全局最大频繁项集。挖掘增量数据库的全局频繁项目,构建增量数据库的FP-tree,挖掘出增量数据库的全局最大频繁项集,采用自上而下的剪枝策略更新全局最大频繁项集。理论分析和实验结果表明,IUGMFI算法是快速而有效的。
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:442kb
    • 提供者:weixin_38694566
  1. MAXFP-M iner: 利用FP- tree 快速挖掘最大频繁项集

  2. 为提高频繁项集的挖掘效率, 提出了最大频繁项集树的概念和基于FP2t ree 的最大频繁项集挖掘算法 MAXFP2M iner. 首先建立了FP2t ree, 在此基础上建立最大频繁项集树MAXFP2t ree,MAXFP2t ree 中包含了所有最 大频繁项集, 缩小了搜索空间, 提高了算法的效率. 算法分析和实验表明, 该算法特别适合于挖掘稠密型及具有长频 繁项集的数据集.
  3. 所属分类:其它

    • 发布日期:2021-01-15
    • 文件大小:258kb
    • 提供者:weixin_38546817
  1. 用有序FP-tree挖掘最大频繁项集

  2. 提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法--MFIM算法,该算法利用有序FP-tree 中的完全前缀路径对挖掘算法进行优化.实验结果表明,该算法对于浓密数据集中挖掘长模式具有较好的性能.
  3. 所属分类:其它

    • 发布日期:2021-01-15
    • 文件大小:608kb
    • 提供者:weixin_38565631
  1. 快速挖掘分布式数据库全局最大频繁项集

  2. 提出一种快速挖掘分布式数据库全局最大频繁项集算法(FMMFI). FMMFI 算法首先设置了中心节点, 并以 各个节点构建局部FP-tree, 采用挖掘最大频繁项目集算法(DMFIA) 快速挖掘局部最大频繁项集; 然后与中心节点交 互以实现数据汇总; 最终获得全局最大频繁项集. FMMFI 算法采用自上而下的剪枝策略, 能大幅减少候选项集, 降低 通信量. 理论分析和实验结果表明, FMMFI 算法是有效的.
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:214kb
    • 提供者:weixin_38674124
« 12 »