您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 浅析基于BBS数据挖掘的研究.pdf

  2. 互联网缩短了人们之间的距离,各种网络交流工具为人们提供了丰富的交流平台。其中BBS具有强大实时交互功能,受到人们的青睐。但是BBS中海量的信息给信息管理带来了困难。因此针对BBS的数据挖掘技术的研究显得尤为重要。
  3. 所属分类:网络基础

    • 发布日期:2010-05-01
    • 文件大小:265kb
    • 提供者:twentysth
  1. 云计算下的海量数据挖掘研究

  2. 基于hadoop分布式平台的海量数据挖掘研究
  3. 所属分类:专业指导

    • 发布日期:2011-01-25
    • 文件大小:275kb
    • 提供者:chhjln
  1. BC-PDM使用说明书

  2. 中国移动通信研究院业务支撑研究所开发的云计算平台下的海量数据挖掘平台
  3. 所属分类:专业指导

    • 发布日期:2011-02-22
    • 文件大小:13mb
    • 提供者:xxjune_2006
  1. 搭建基于云计算的开源海量数据挖掘平台.caj

  2. 搭建基于云计算的开源海量数据挖掘平台.caj
  3. 所属分类:其它

    • 发布日期:2011-04-30
    • 文件大小:353kb
    • 提供者:zhanglinsi
  1. 推荐系统论文

  2. 个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
  3. 所属分类:电子商务

    • 发布日期:2011-12-07
    • 文件大小:3mb
    • 提供者:geniuslb2001
  1. 搭建基于云计算的开源海量数据挖掘平台

  2. 通过分析亚马逊弹性 M apRe duce( EMR)平台构架, 针对信息情报机构内部数据处理的迫切需求, 提出通 过开源技术 Xen和 H adoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、 海量文本数 据处理案例和开源 EMR平台的优势分析。实施方案主要分为三部分: 搭建动态虚拟的云计算环境、 安装制作 H adoop虚拟服务器模板、 配置运行 C l oudera和 C l oudera Desktop。通过开源 EMR架构的应用, 可以有效解决服务 器蔓延问题,
  3. 所属分类:虚拟化

    • 发布日期:2012-04-23
    • 文件大小:390kb
    • 提供者:dominolu
  1. 海量数据处理平台体系架构分析

  2. 综述了主流海量数据分析平台的架构,以hadoop为例详细分析了分布式结构在当前海量数据处理汇总的应用。
  3. 所属分类:互联网

    • 发布日期:2012-12-15
    • 文件大小:642kb
    • 提供者:hohai2337
  1. JAVADIGGER社交网络数据挖掘分析系统

  2. DIGGER社交网络数据挖掘分析系统,本系统的挖掘工作是在WEKA平台下进行的,WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。DIGGER作为一个社交网络系统,它利用数据挖掘工具WEKA在大规模海量数据中建立模型和发现数据间关系,这些模型和关系可以用来做出决策和预测。
  3. 所属分类:Java

    • 发布日期:2013-06-16
    • 文件大小:2mb
    • 提供者:ggdfuib
  1. 基于云计算的海量数据挖掘_何清

  2. 云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,以服务的方式提供。云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算是虚拟化(Virtualization)、效用计算(UtilityComputing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件
  3. 所属分类:Web开发

    • 发布日期:2013-12-17
    • 文件大小:1mb
    • 提供者:u013185451
  1. 大数据实时计算实践:百分点架构和算法

  2. 介绍了大数据平台的基本原理,并详细说明了其中与实时计算相关部分,实时计算框架和数据查询框架的系统架构、处理流程和应用。而后,我们以海量数据计数问题为例,深入浅出的介绍了在实时计算算法中常用的方法和技巧,以及它们适用的场景和可能带来的问题。这些方法和技巧具有普遍性和通用性,被广泛应用于个性化推荐引擎的各个模块,包括用户意图预测、用户画像、个性化推荐评分、商品分类等等。如果能在实际业务中灵活运用这些方法和技巧,则能够大大提高实时计算的数据规模和处理效率,帮助业务快速发展。
  3. 所属分类:Web开发

    • 发布日期:2014-02-28
    • 文件大小:538kb
    • 提供者:u013789577
  1. weka软件分析解析

  2. We ka 己 经逐渐成为一个国际知名的数据挖掘平台,其免费开源、算 法丰富、架构相对规范、兼容性好,因此吸引1越来越多的研究者参入其 中。随着数据挖掘技术在海量信息处理中卓越的表现,数据挖掘系统的设 计也会越来越有价值,但由于商业数据挖掘系统设计和代码的保密性,开 源的Weka是一个不可多得的选择,就像Linux正在吸引更多的用户和内 核研究者一样,Weka在数据挖掘界也将可能势不可挡。
  3. 所属分类:Linux

    • 发布日期:2009-03-29
    • 文件大小:3mb
    • 提供者:benben0826
  1. 数据挖掘工具(weka教程)

  2. 由于Weka的开源、易操作等优点,可供各类人群学习、使用。如果是一位数据挖掘算法的研究者,可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种关系。如果是数据挖掘的初学者,这是最好的学习平台,它不但简单易学,还提供了八个数据挖掘、统计学上的经典案例供您参考;如果在工作中有大量的数据需要分析,Weka也许能帮您发现更大的商机。
  3. 所属分类:机器学习

  1. 基于Hadoop的数据挖掘算法研究与实现

  2. 随着移动智能操作系统技术的突破,智能手机的普及,移动互联网时代的到来,web app每天都在产生TB甚至PB级的web日志,如何从这些海量日志信息中提取用户的个人爱好及其他信息,为用户提供个性化推荐服务,为人们的生活带来便利,成为各大互联网公司和科研机构研究人员的研究热点。由于开源云计算平台Hadoop的出现,解决海量web日志信息的数据挖掘成为可能。 本文的研究内容主要包含以下几个方面: 一、对Hadoop云计算平台进行研究。Hadoop是Apache下的顶级开源项目,该平台能够利用成千上万的
  3. 所属分类:Hadoop

    • 发布日期:2020-01-15
    • 文件大小:9mb
    • 提供者:sunearlier
  1. Vertica实时数据分析平台

  2. 深度介绍Vertica产品总体架构、核心优势、集群能力、Vertica与Hadoop的数据交换、SQL高级分析、与分布式R无缝集成、灾备能力等等,是不可多得的了解Vertica的好资料。数据分析平台演进阶段及挑战 事件触发,全量数据实时分析频 价值实 业务相关性分析 繁访问 产品分析、用户行为分析客客户活动预测,客户流失预测,直接提升业务 户分析等灵活直询和数据分析产品盈利预测 面向大量业务人员 MOLAP CUBE生成 面向少量管理者的机器学习和 现整合层行业模型批量加工 预测 监管报送等数据
  3. 所属分类:Hadoop

    • 发布日期:2019-04-20
    • 文件大小:4mb
    • 提供者:skyon
  1. PDMiner:基于云计算的并行分布式数据挖掘工具平台

  2. 随着信息技术和互联网的发展,各种信息呈现爆炸性增长,且包含丰富的知识.从海量数据信息中挖掘得到有用的知识仍然是一个挑战性的课题.近几十年来,数据挖掘技术,作为从海量数据信息中挖掘有用信息的关键技术已经引起了广泛的兴趣和研究.但是由于数据规模的增长,以往的很多研究工作并不能有效地处理大规模数据,因此,开发设计或者扩展已有算法使之能处理大规模数据集,已经成为数据挖掘中非常重要的研究课题.近年来,基于云计算的数据挖掘技术研究已经成为一个热点话题,本文中我们研究开发一个基于大规模数据处理平台Hadoop
  3. 所属分类:其它

  1. 具有自适应异常处理和并行数据挖掘功能的面向成长型企业的大数据云服务平台

  2. 大型成长型公司需要大数据分析平台,同时很难自行构建。 基于云计算技术,大数据分析可以转移到云中,并利用便宜的SaaS模型以及企业应用程序的“云+端”模式优势,帮助企业收集和存储数据,以提供海量数据分析和可视化服务。 在平台的设计中,智能计算扮演着重要的角色。 为了处理需求和服务组合场景变化的异常处理,运行时自适应优化机制采用空间搜索优化算法SSOA。 在平台架构的计算管理层,我们对传统的数据挖掘方法进行了并行转换。 已经提出了K-均值并行化方法。 基于标签的领域专家发现也已经设计和实现。 结合理
  3. 所属分类:其它

  1. 基于云计算的大数据挖掘平台

  2. 开发了一个基于云计算的并行分布式大数据挖掘平台——PDMiner。PDMiner实现了各种并行数据挖掘算法,如数据预处理、关联规则分析以及分类、聚类等算法。实验结果表明,并行分布式数据挖掘平台PDMiner中实现的并行算法,能够处理大规模数据集,达到太字节级;具有很好的加速比性能;实现的并行算法可以在商用机器构建的并行平台上稳定运行,整合了已有的计算资源,提高了计算资源的利用效率;可以有效地应用到实际海量数据挖掘中。在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖
  3. 所属分类:其它

  1. 基于Hadoop云平台的并行数据挖掘方法

  2. 业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题。为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出了在Hadoop上一种高效数据挖掘框架,利用数据库来模拟链表结构,管理挖掘出来的知识,提供了树形结构、图模型的分布式计算方法;在此基础上实现一个统计算法——Yscore分箱算法,以及决策树和KD树的建树算法;并利用Vega云对Hadoop集群进行仿真。实验数据表明
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:489kb
    • 提供者:weixin_38606404
  1. 大数据下的数据分析平台架构

  2. 随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。作为一家互联网数据分析公司,我们在海量数据的分析领域那真是被“逼上梁山”。多年来在严苛的业务需求和数据压力下,我们几乎尝试了所有可能的大数据分析方法,最终落地于Hadoop平台之上。Hadoop在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流的大数据分
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:221kb
    • 提供者:weixin_38693173
  1. 云时代的企业应用数据挖掘

  2. 本文主要分析了企业面对云时代的SaaS服务时,如何有效地对应用数据进行数据挖掘。首先分析了企业面对海量增长的数据时数据挖掘面临的挑战,其次提出了一种适合云应用环境的数据挖掘模式,最后对该方法进行了总结。随着云时代的到来和SaaS概念的引入,越来越多的企业开始选择由SaaS应用提供商、运营商等通过互联网平台提供SaaS应用服务,SaaS应用的数据量面临着TB级的增长速度;不同的SaaS应用体系,提供的数据结构也不完全相同,数据有文本、图形甚至小型数据库;SaaS应用数据随着云服务平台的分布性特点,
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:125kb
    • 提供者:weixin_38512659
« 12 3 4 5 6 »