您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于MapReduce的频繁闭相集挖掘算法

  2. 繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算 平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于I-ladoop云计算平台的频 繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局 频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比.
  3. 所属分类:数据库

    • 发布日期:2013-01-11
    • 文件大小:871kb
    • 提供者:zhenzhenmomo
  1. Hadoop从业者为什么需要Spark?

  2. Hadoop从业者为什么需要Spark?答案是Hadoop已死,Spark称霸。 而Hadoop的死亡过程在2012年已经开始: 1,由于Hadoop自身架构的导致了在离线数据存储分析意外的一切领域都力不从心,理论已经证明MapReduce模型可以模拟一切分布式计算,但是效率成为其死穴,而Spark基于RDD的计算图可以轻松、完整地表达MapReduce模型,并且能极为容易的处理实时流计算、机器学习、图计算、误差查询等; 2,2012年以来Hadoop本身架构臃肿并未得到本质性的改善,很多修改
  3. 所属分类:虚拟化

    • 发布日期:2014-09-22
    • 文件大小:412kb
    • 提供者:javaniceyou
  1. “互联网+”金融论坛—基于大数据的互联网金融创新—许泽玮

  2. 中国大数据专家委员会委员、中国电子学会云计算专家委员会委员、九一金融信息服务(北京)有限公司创始人兼CEO许泽玮认为在整个互联网传统金融服务领域里存在三个不对称:信息不对称、知识不对称、服务不对称,并且这三个不对称都可以靠技术解决,以及这三个不对称解决的是信息流和资金流问题。互联网金融不再只是传统金融业务效率的提升,而是基于信息流、资金流产生的创新能力和风险控制能力,和对产品定价能力。回到核心的金融生态系统,核心还是金融,包含整个的对接金融机构产品的服务,这里平台价值很大,最核心的是真实用户数
  3. 所属分类:虚拟化

    • 发布日期:2015-06-23
    • 文件大小:908kb
    • 提供者:happytofly
  1. 2016大数据技术大会

  2. 2016大数据技术大会,来自一线互联网(含bat)厂商顶级大学的大数据实践经验, 包含以下主题: ​百度大规模推荐系统实践 京东数据库备份系统进化之路​ ​腾讯大数据能力输出之路 基于图算法的跨设备受众识别 ​360聚效广告大数据平台实践​ ​领域知识驱动的个性化推荐方法 大数据基础组建的安全解决方案 ​大数据视野下的数据安全防护体系探索​大数据安全防护​ ARM嵌入式系统的DNN性能优化 ​Gemini:基于图计算的高性能大数据分析系统 ​下一代实时数据处理引擎——Apache Apex项目
  3. 所属分类:专业指导

    • 发布日期:2017-03-09
    • 文件大小:75mb
    • 提供者:dreamfarwhb
  1. 电动汽车OBD及管理系统方案ppt

  2. 基于“云”计算架构的大数据车辆信息与人车互动平台。实现对海量涉车数据的存储、计算、管理、监控、分析、挖掘及应用是系统互联与智能的核心
  3. 所属分类:交通

    • 发布日期:2018-03-24
    • 文件大小:4mb
    • 提供者:marguess
  1. 基于云计算的Web数据挖掘Hadoop仿真平台研究

  2. 自2007年以来,随着云计算被广泛的应用到互联网,大量的服务器终端数据如何有效的组织,以便稳定、高效的运行已成为当前亟待解决的问题,基于云计算的web数据挖掘Hadoop仿真平台能够较快速的通过相关的网络结构,解决服务器地域分布较为分散,数据流量大等网络关键难题,最终实现仿真运算,从而提高网络平台的性能,最终达到云计算环境下的高速分布式计算的目标。
  3. 所属分类:Hadoop

    • 发布日期:2018-06-29
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 2019年重庆市职业院校技能大赛高职组“云计算技术与应用”赛项竞赛样题

  2. 2019年重庆市职业院校技能大赛高职组“云计算技术与应用”赛项竞赛样题 1. 竞赛试题通过在线“云计算技术与应用”竞赛考试系统和书面文档共同发布,内容完全一致,如出现纸质任务书缺页、字迹不清、与考试系统中不一致等问题,请及时向裁判示意,并进行任务书的更换。 2. 参赛团队应在 4 小时内完成任务书规定内容;选手在竞赛过程中各系统生成的运行记录或程序文件必须存储到在线“云计算技术与应用”竞赛考试系统指定的用户账户中,未存储到指定账户的运行记录或程序文件均不予给分。 3. 选手提交的试卷用工位号标
  3. 所属分类:Openstack

    • 发布日期:2019-03-17
    • 文件大小:248kb
    • 提供者:qq_38661333
  1. 基于自动化测试的反爬虫技术研究_以天猫平台为例_曹文斌

  2. 随着大数据、云计算、移动互联网等新兴信息技术地快速兴起,人们工作生活对互联网的依赖逐步加强,越来越多用 户行为数据、发表意见评论数据分散在互联网上。如何有效地采集这些数据,是分析、挖掘数据的前提。传统爬虫方 式通常是从一个节点开始,盲目地、发散式地扩张遍历网页来获取数据,这种方式一方面近年来受到反爬虫技术的限 制,另一方面获取数据的效率和质量偏低。在深入研究天猫平台网站结构的基础上,采用自动化测试技术模拟人浏 览网页的方式,结合电商平台的搜索引擎有效地避开反爬虫技术地限制,采集到的数据准确率达
  3. 所属分类:网络安全

    • 发布日期:2019-04-16
    • 文件大小:1mb
    • 提供者:m0_37968739
  1. 2019年全国职业院校技能大赛高职组“云计算技术与应用”赛项试题(样卷)

  2. 2019年全国职业院校技能大赛云计算技术与应用竞赛样卷 题目:“企业云服务平台系统”的设计与实现 【选手须知】 1.竞赛试题通过在线“云计算技术与应用”竞赛考试系统和书面文档共同发布,内容完全一致,如出现纸质任务书缺页、字迹不清、与考试系统中不一致等问题,请及时向裁判示意,并进行任务书的更换。 2.参赛团队应在4小时内完成任务书规定内容;选手在竞赛过程中各系统生成的运行记录或程序文件必须存储到在线“云计算技术与应用”竞赛考试系统指定的用户账户中,未存储到指定账户的运行记录或程序文件均不予给分。
  3. 所属分类:Openstack

    • 发布日期:2019-04-25
    • 文件大小:512kb
    • 提供者:qq_38661333
  1. 基于Hadoop的数据挖掘算法研究与实现

  2. 随着移动智能操作系统技术的突破,智能手机的普及,移动互联网时代的到来,web app每天都在产生TB甚至PB级的web日志,如何从这些海量日志信息中提取用户的个人爱好及其他信息,为用户提供个性化推荐服务,为人们的生活带来便利,成为各大互联网公司和科研机构研究人员的研究热点。由于开源云计算平台Hadoop的出现,解决海量web日志信息的数据挖掘成为可能。 本文的研究内容主要包含以下几个方面: 一、对Hadoop云计算平台进行研究。Hadoop是Apache下的顶级开源项目,该平台能够利用成千上万的
  3. 所属分类:Hadoop

    • 发布日期:2020-01-15
    • 文件大小:9mb
    • 提供者:sunearlier
  1. 恩拓协议ETS白皮书.pdf

  2. 恩拓协议(ETS)是释放价值互联网潜能的可信数据协议,旨在为区块链链上数据共享与数据交易的隐私保护问题提供新的思路和技术支持。7.3智慧物联网 37 74注意力经济 37 八、代币经济模型 ■■■■■■■■■看■■■■■■■■■■■■■■■■■■■■■■■■■着■■■■■■■■■■■■■■看■■■■■■■■■■■■■■■■ 38 参者文献 41 EncryTrust:一种新型分布式加密计算协议 摘要 针对当前互联网时代数据交互及交易流程中的数据造假、数据截留、数据泄漏 等数据安全问题,提出了一
  3. 所属分类:以太坊

    • 发布日期:2019-09-02
    • 文件大小:2mb
    • 提供者:etschina
  1. 2-童小军-运用Hadoop构建数据仓库平台.pdf

  2. 童小军-运用Hadoop构建数据仓库平台 基于Hadoop构建数据仓库云平台(DAAS) 思想,原理,成本,案例 专注于企业级大数据EasyHadop 社区创始人提纲 数据开放数据云服务平台(DAAS)时代 Hadoop平台在数据云平台(DAAS上的天然优势 数据云平台DAAS平台组成部分 互联网公共数据大云DAAS案例 Hadoop构建构建游戏云 Web Game Daas平台 RedHadoop 专注于企业级大数据 四点 BDaaS-Big Data As A Service 大数据即服务
  3. 所属分类:Hadoop

    • 发布日期:2019-07-06
    • 文件大小:3mb
    • 提供者:u010461615
  1. 我国大数据产业前景趋势与投资规划分析简报.pdf

  2. 我国大数据产业前景趋势与投资规划分析简报.pdf●中国大数据产业发展现状与前景预测 1.中国大数据产业发展现状分析 大数据产业链建设情况 大数据产业市场规模分析 目前,「产业在发展过程中已经形成了一些层次分据贵阳大数据交易所发布的《2016年中国大数据交 布,有做服务器和底层系统的,有做软件的,有做易产业白皮书》数据显示,2014年,中国大数据产 应用的,大数据也需要在原有的架构上加以发展。业规模大约为1038亿元,2015年产业整体规模达 原来做基础设施的企业,如联想、华为,也要向大到169
  3. 所属分类:互联网

    • 发布日期:2019-07-03
    • 文件大小:1mb
    • 提供者:qq_34543438
  1. 云环境下K-means算法的并行化

  2. 随着大数据时代的到来,传统的聚类算法很难高效地处理海量数据,而云计算平台凭借负载均衡、网络存储、虚拟化等技术,有效地突破了耗时耗能的瓶颈,为海量数据的处理提供了良好的解决方案。主要研究了Hadoop平台下的MapReduce编程模型及传统K-means算法,提出了一种基于MapReduce的并行化K-means算法的设计方案,包括Map函数和Reduce函数的设计。通过实验,验证了并行化K-means算法适用于较大规模数据集的分析和挖掘。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:328kb
    • 提供者:weixin_38688890
  1. 具有自适应异常处理和并行数据挖掘功能的面向成长型企业的大数据云服务平台

  2. 大型成长型公司需要大数据分析平台,同时很难自行构建。 基于云计算技术,大数据分析可以转移到云中,并利用便宜的SaaS模型以及企业应用程序的“云+端”模式优势,帮助企业收集和存储数据,以提供海量数据分析和可视化服务。 在平台的设计中,智能计算扮演着重要的角色。 为了处理需求和服务组合场景变化的异常处理,运行时自适应优化机制采用空间搜索优化算法SSOA。 在平台架构的计算管理层,我们对传统的数据挖掘方法进行了并行转换。 已经提出了K-均值并行化方法。 基于标签的领域专家发现也已经设计和实现。 结合理
  3. 所属分类:其它

  1. 解析阿里云大数据服务——ODPS

  2. 基于飞天的ODPS,对内是阿里集团30多个事业部唯一的大数据处理平台;对外,以RESTfulAPI对外提供数据仓库、数据挖掘和其他数据应用服务。阿里云总裁王文彬为之站场,称其为“中国进入大数据时代的里程碑”。阿里云有许多很好的技术,比如负载均衡SLB,关系型数据库RDS,云服务器ECS,开放存储服务OSS等。如今又增加了一款重磅云服务产品:基于飞天的ODPS(OpenDataProcessingService),提供数据仓库、数据挖掘和其他数据应用等功能。7月14日,阿里云计算公司总裁及*
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:248kb
    • 提供者:weixin_38502183
  1. 一种基于MapReduce的频繁闭项集挖掘算法

  2. 频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比.
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:301kb
    • 提供者:weixin_38695751
  1. 解析阿里云大数据服务——ODPS

  2. 基于飞天的ODPS,对内是阿里集团30多个事业部唯一的大数据处理平台;对外,以RESTfulAPI对外提供数据仓库、数据挖掘和其他数据应用服务。阿里云总裁王文彬为之站场,称其为“中国进入大数据时代的里程碑”。阿里云有许多很好的技术,比如负载均衡SLB,关系型数据库RDS,云服务器ECS,开放存储服务OSS等。如今又增加了一款重磅云服务产品:基于飞天的ODPS(OpenDataProcessingService),提供数据仓库、数据挖掘和其他数据应用等功能。7月14日,阿里云计算公司总裁及*
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:248kb
    • 提供者:weixin_38516190
  1. 基于云计算的大数据挖掘平台

  2. 开发了一个基于云计算的并行分布式大数据挖掘平台——PDMiner。PDMiner实现了各种并行数据挖掘算法,如数据预处理、关联规则分析以及分类、聚类等算法。实验结果表明,并行分布式数据挖掘平台PDMiner中实现的并行算法,能够处理大规模数据集,达到太字节级;具有很好的加速比性能;实现的并行算法可以在商用机器构建的并行平台上稳定运行,整合了已有的计算资源,提高了计算资源的利用效率;可以有效地应用到实际海量数据挖掘中。在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖
  3. 所属分类:其它

  1. 基于云计算的大数据挖掘平台设计

  2. 随着网络技术的迅速发展,人们接收的数据日益增多,如何能够在较短时间内提取出大量有用的信息成为现阶段计算机处理信息的研究热点。针对该问题,文中提出了一种基于云计算的数据挖掘技术,该挖掘系统的实现,从理论上拓展了数据规约功能,同时在此基础上提出并解决了数据访问及数据类型的难题。最后,通过实验验证了该系统的高效性及可行性。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:634kb
    • 提供者:weixin_38692836
« 12 »