您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Google 大数据三论文 Bigtable GFS MapReduce

  2. Bigtable:一个分布式的结构化数据存储系统; The Google File System; MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现
  3. 所属分类:互联网

    • 发布日期:2013-02-15
    • 文件大小:2mb
    • 提供者:zhiweiarm
  1. java 大数据处理

  2. java 大数据处理 java千万级别数据生成文件思路和优化 面试时候问到的我就找了一下
  3. 所属分类:Java

    • 发布日期:2013-03-12
    • 文件大小:104kb
    • 提供者:stillcity
  1. sql生成大数据量表示例

  2. 一个小小的示例,涉及到字符拼接,应该会有用
  3. 所属分类:SQLServer

    • 发布日期:2013-05-19
    • 文件大小:2kb
    • 提供者:u010008090
  1. java大数据

  2. java大数据
  3. 所属分类:Java

    • 发布日期:2013-07-29
    • 文件大小:8mb
    • 提供者:u011090364
  1. 大数据Excel操作不会内存溢出POI

  2. 从别人那用25分下载,包括三个源码,现整合1分分享给大家!!!! 绝对原创,这是我在项目中解决大数据Excel导入时内存溢出问题而编写的Excel行级解析器。同时支持Excel-2003和Excel-2007,excel-2003解析采用poi的eventusermodel模式实现,2007采用xmlreader实现,经项目验证,excel文件20W条数据没有任何问题,仅读取的话2-3分钟解析完毕。 网络上有关eventusermodel方式解析的资料太少,我花费时间较多,因此分数较高,但绝对
  3. 所属分类:Java

    • 发布日期:2013-07-29
    • 文件大小:98kb
    • 提供者:shenshenjp
  1. 陈跃国:SQL-on-Hadoop结构化大数据分析系统性能评测

  2. 陈跃国介绍了关系型结构大数据的概念以及特点,并阐述了TPC-DS基准对于实时大数据分析应用的局限性。近期,陈跃国进行了一次大规模的测试,利用人民大学的云平台,使用50台物理机,虚拟出了100个节点,并用使用TPC-DS生成不同规模的关系型数据,测试了开源大数据分析系统。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1mb
    • 提供者:u011299305
  1. IBM分析大数据平台架构

  2. IBM InfoSphere Streams 是 IBM 大数据平台中支持构建和部署持续实时分析 应用程序以分析动态数据的技术组件。这些应用程序将持续不断地寻找数据流 中的模式。检测到模式后,将分析模式的影响,并即时制定实时决策,从而加 强竞争优势。示例包括分析金融市场交易行为、分析 RFID 数据以实现供应链和 分销链优化,监控传感器数据以支持制造流程控制,新生儿重症监护室监控, 实时欺诈防范和执法中的实时多模式监测。IBM InfoSphere Streams 能同时监 控多个外部和内部事
  3. 所属分类:其它

    • 发布日期:2015-08-22
    • 文件大小:874kb
    • 提供者:qq_26764643
  1. java导出100万以上excel大数据样例

  2. java导出excel大数据,由于excel本身sheet页存储条数的限制,方案一般有:1、导出多个excel,然后将多个excel压缩为zip包,导出;2、导出可以通过excel打开的文本文件;3、导出csv文件(简单格式的)。 本样例以导出可以打开为excel的文本文件为例,来实现导出大数据的excel,结合stringtemplate模板引擎库,可以避免内存溢出,提高生成效率,理论上生成100万行的数据,用时30-60s。
  3. 所属分类:Java

    • 发布日期:2016-07-30
    • 文件大小:1mb
    • 提供者:zywwin222
  1. [rar文件] java导出100万以上excel大数据样例

  2. 一、该demo解决的问题: 1、 大数据导出excel文件; 2、 Excel导出大数据时内存溢出; 二、思路:将数据存储到一个.xls的文件内,实际写入的是可以通过excel打开的html文本文件。由于文本文件可以进行续写,可以避免内存溢出。 三、优点:结合stringtemplate模板引擎库生成速度快,可以定义excel格式。 内有文档说明。
  3. 所属分类:Java

    • 发布日期:2016-07-30
    • 文件大小:1mb
    • 提供者:zywwin222
  1. poi导出大数据,先生成多个excel在生成一个jar包

  2. poi导出大数据,先生成多个excel在生成一个jar包
  3. 所属分类:Java

    • 发布日期:2017-04-19
    • 文件大小:21kb
    • 提供者:a087160a
  1. POI实现大数据EXCLE导入导出,解决内存溢出问题

  2. 使用POI能够导出大数据保证内存不溢出的一个重要原因是SXSSFWorkbook生成的EXCEL为2007版本,修改EXCEL2007文件后缀为ZIP打开可以看到,每一个Sheet都是一个xml文件,单元格格式和单元格坐标均用标签表示。直接使用SXSSFWorkbook来到导出EXCEL本身就是POI为了大数据量导出而量身定制的,所以导出可以直接使用SXSSFWorkbook方式。   为了保险起见可以采用多Sheet的方式保证内存不溢出。需要注意的是Sheet名称不能重复;下载的时候需要定义
  3. 所属分类:算法与数据结构

    • 发布日期:2017-10-16
    • 文件大小:34kb
    • 提供者:youyou_yo
  1. 运维大数据

  2. 当今世界,公司的日常运营经常会生成TB级别的数据。数据来源囊括了互联网装置可以捕获的任何类型数据,网站、社交媒体、交易型商业数据以及其它商业环境中创建的数据。考虑到数据的生成量,实时处理成为了许多机构需要面对的首要挑战。我们经常用的一个非常有效的开源实时计算工具就是Storm —— Twitter开发,通常被比作“实时的Hadoop”。然而Storm远比Hadoop来的简单,因为用它处理大数据不会带来新老技术的交替。
  3. 所属分类:Storm

    • 发布日期:2017-11-01
    • 文件大小:2mb
    • 提供者:yiwangtiankong
  1. 基于共轭梯度对数分解的大数据分类模型

  2. 提出一种基于共轭梯度对数分解的大数据分类数学仿真模型。构建基于K-means算法的数据分类目标数据生成模型,采用共轭梯度对数分解方法对大数据集进行规范化处理,构建数据融合适应度矩阵,基于Lagrange定理,全局搜索性寻找聚类中心的最佳值求得聚类目标函数,确定边界隶属度特征的一个初始值,实现对大数据分类模型优化设计。仿真实验表明,采用该分类模型,数据分类寻优性能较好,各类数据的特征分类准确,收敛性较高。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-19
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 位置大数据的价值提取与协同挖掘方法

  2. 随着位置服务和车联网应用的不断普及,由地理数据、车辆轨迹和应用记录等所构成的位置大数据已成为当前用来感知人类社群活动规律、分析地理国情和构建智慧城市的重要战略性资源,是大数据科学研究极其重要的一部分.与传统小样统计不同,大规模位置数据存在明显的混杂性、复杂性和稀疏性,需要对其进行价值提取和协同挖掘,才能获得更为准确的移动行为模式和区域局部特征,从而还原和生成满足关联应用分析的整体数据模型.因此,着重从以下3个方面系统综述了针对位置大数据的分析方法,包括:(1)针对数据混杂性,如何先从局部提取出
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 面向分布式数据流大数据分类的多变量决策树

  2. 分布式数据流大数据中的类别边界不规则且易变,因此基于单变量决策树的集成分类器需要较大数量的基分类器才能准确地近似表达类别边界,这将降低集成分类器的学习与分类性能.因而,本文提出了基于几何轮廓相似度的多变量决策树.在最优基准向量的引导下将n维空间样本点投影到一维空间以建立有序投影点集合,然后通过类别投影边界将有序投影点集合划分为多个子集,接着分别对不同类别集合的交集递归投影分裂,最终生成决策树.实验表明:本文提出的多变量决策树GODT具有很高的分类精度和较低的训练时间,有效结合了单变量决策树学习
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 基于贝叶斯网络的复杂事件大数据处理系统测试数据生成方法研究

  2. 伴随流式数据处理需求而产生的复杂事件处理技术,在处理具有多样性和流式特征数据方面性能表现突出,被广泛应用于复杂事件大数据处理系统中。针对复杂事件大数据处理系统测试需求,提出一种基于贝叶斯网络的复杂事件大数据处理系统测试数据生成方法,该方法以部分真实数据中的复杂事件结构关系及概率分布特征构建贝叶斯网络预测模型,生成具有真实数据结构特征与分布特征的复杂事件测试数据集。实验结果表明,提出的方法具有可行性。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 一种大数据交互式挖掘框架与实现

  2. 在传统的数据挖掘过程中,用户需根据专业知识对数据进行预处理,为模型设定参数后构建模型,通过评估指标判断模型是否可行。该过程的不便性体现在模型以黑盒的方式构建,用户不可见其中间过程,模型产生的结果也不易被理解。在海量数据的环境下,传统数据挖掘过程在预处理时异常数据的定位和模型生成后知识的表达方面都有不便。为了解决传统数据挖掘过程存在的问题,本文提出了一种大数据环境下的交互式数据挖掘框架。该框架使交互贯穿整个数据挖掘的过程,使得用户可以轻松定位异常输入源数据,参与模型训练过程,对模型生成的结果溯源
  3. 所属分类:spark

    • 发布日期:2018-06-22
    • 文件大小:3mb
    • 提供者:qq_28339273
  1. 大数据一秒生成5000000不重复ID

  2. 大数据一秒生成5000000不重复ID SnowflakeIDWorker 用到 long timestamp = timeGen(); timestamp 以及上一个 timestamp 加位移.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-11-16
    • 文件大小:4kb
    • 提供者:qq_37675011
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. 高能物理的高性能数值计算:大数据科学的新挑战

  2. 现代物理学是基于理论分析和实验验证的。 亚理论尺寸,高能量和较低的绝对温度等复杂场景是许多理论模型的前沿领域。 使用稳定的数值方法进行的仿真是用于高精度分析,实验验证和可视化的极佳工具。 高性能计算支持提供了并行进行大规模仿真的可能性,但是这些实验生成的数据量给大数据科学带来了新的挑战。 本文从两个角度介绍了现有的高能物理(HEP)计算方法:数值方法和高性能计算。 提出的计算方法是Monte Carlo方法和HEP过程的模拟,Markovian Monte Carlo,粒子物理学中的展开方法,H
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »