您好,欢迎光临本网站![请登录][注册会员]  
文件名称: 一种使用N-list快速挖掘频繁项集的新算法
  所属分类: 其它
  开发工具:
  文件大小: 1mb
  下载次数: 0
  上传时间: 2021-03-16
  提 供 者: weixin_********
 详细说明:频繁项目集的挖掘已成为数据挖掘中的一个基本问题,并且在许多重要的数据挖掘任务中发挥着至关重要的作用。 在本文中,我们提出了一种新颖的垂直数据表示形式,称为N-list,该表示形式源自于一种类似于FP-tree的编码前缀树(称为PPC-tree),该树存储了有关频繁项集的关键信息。 基于N列表数据结构,我们开发了一种有效的挖掘算法PrePost,用于挖掘所有频繁项集。 PrePost的效率是通过以下三个原因实现的。 首先,N-list是紧凑的,因为具有公共前缀的事务共享PPC树的相同节点。 其次,将项目集支持的计数转换为N个列表的交集,并且可以通过有效策略将两个N个列表相交的复杂度降低为O(m + n),其中m和n是基数的基数。两个N列表。 第三,在某些情况下,PrePost可以通过使用N-list的单路径属性直接找到频繁的项目集,而无需生成候选项目集。 我们已针对四种最先进的算法对PrePost进行了实验评估,这些算法可在各种真实和合成数据集上挖掘频繁项集。 实验结果表明,PrePost算法在大多数情况下是最快的。 即使当数据集稀疏时该算法消耗了更多的内存,它仍然是最快的算法。
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: