您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. C++,数据结构,笔试面试

  2. C++基础知识,数据结构系统复习,笔试面试复习,互联网企业海量数据处理等问题
  3. 所属分类:C++

    • 发布日期:2012-03-30
    • 文件大小:44mb
    • 提供者:qzh720
  1. 搭建基于云计算的开源海量数据挖掘平台

  2. 通过分析亚马逊弹性 M apRe duce( EMR)平台构架, 针对信息情报机构内部数据处理的迫切需求, 提出通 过开源技术 Xen和 H adoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、 海量文本数 据处理案例和开源 EMR平台的优势分析。实施方案主要分为三部分: 搭建动态虚拟的云计算环境、 安装制作 H adoop虚拟服务器模板、 配置运行 C l oudera和 C l oudera Desktop。通过开源 EMR架构的应用, 可以有效解决服务 器蔓延问题,
  3. 所属分类:虚拟化

    • 发布日期:2012-04-23
    • 文件大小:390kb
    • 提供者:dominolu
  1. C++图书管理系统

  2. 用户交互所有插入、更新、删除、查询操作的设计与实现; 文件存储机制的设计与实现,包括以64KB为单位存储; Java程序从互联网抓取并处理图书信息数据(未提供)。 书籍管理(查询与排序部分)和书籍类别管理的设计与实现 利用C++语言实现信息的存储和海量数据的处理
  3. 所属分类:C++

    • 发布日期:2013-03-11
    • 文件大小:11mb
    • 提供者:liubin_09
  1. 海量数据处理的初探--亿级数据的离线计算--LevelDB简单封装

  2. 使用谷歌的leveldb 处理每天近10G、共2亿用户的数据 Linux先上代码,后续讲解思路
  3. 所属分类:C++

    • 发布日期:2013-06-18
    • 文件大小:3kb
    • 提供者:zhenjinsuo
  1. 兼容Office2003-2013的Excel导出或者数据获取解决方案

  2. 此组件组件是采用NPOI2.0为核心二次开发的C#对Office操作的高性能组件,包含以下主要特点:  兼容Office2003到Office2013各个版本的Office的操作,主要包含对Excel数据的导出、获取Office数据文件中的数据等功能  整合了导出DataTable到Excel的方法,可以实现导出到Web程序和Windows桌面程序对Excel文件的操作。  整合了多线程处理技术,针对海量数据的Excel导出,可以保证导出数据的操作流畅性,而不会导致假死等现象的出现。
  3. 所属分类:C#

  1. c语言如何对海量数据进行处理

  2. 1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 2. 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。 3. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 4. 海量日志数据,提取出某日访问百度次数最多的那个IP。(利用hash分而治之,然后上归并,堆) 5. 在
  3. 所属分类:C/C++

    • 发布日期:2014-08-25
    • 文件大小:152kb
    • 提供者:junased
  1. C++网络爬虫项目

  2. WEBCRAWLER 网络爬虫实训项目 1 WEBCRAWLER 网 络 爬 虫 实 训 项 目 文档版本: 1.0.0.1 编写单位: 达内IT培训集团 C++教学研发部 编写人员: 闵卫 定稿日期: 2015年11月20日 星期五WEBCRAWLER 网络爬虫实训项目 2 1. 项目概述 互联网产品形形色色,有产品导向的,有营销导向的,也有技术导向的,但是 以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中最具技 术含量的产品,如果不是唯一,至少也是其中之一。 经过十几年的发展
  3. 所属分类:C/C++

    • 发布日期:2018-07-04
    • 文件大小:4mb
    • 提供者:qq15690515
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. COMOS Platform—全球数据交换实现高效工厂管理.pdf

  2. COMOS Platform—全球数据交换实现高效工厂管理pdf,COMOS Platform—全球数据交换实现高效工厂管理:COMOS Platform是工厂所有工程设计和运营的相关人员在全世界范围unei跨地域协助的基础。借助COMOS Platform,工厂工程奖变得更加高效,并提升公司竞争力。数据表/列表 管道设计 电气设计 控制设计 3D模型 E|8C设计 工艺设计 维护 借助 COMOS而向对象的技术可实现最佳应用序网络 每个细节都非常透明 COMOS通过始终保持一致性和透明性任方随
  3. 所属分类:其它

  1. 基于GIS的数据仓库管理系统开发与实现

  2. 为了解决油气资源信息中的海量数据处理、信息集成和综合利用等问题,提出构建基于GIS的空间数据仓库管理系统。采取面向对象设计方法,以Microsoft Visual Studio2008(C#)为开发工具,分别使用ETL和Oracle 11g OLAP工具进行数据导入和服务开发,对10个专题数据的编码规范、命名规则和数据关联等问题进行了合理部署和设计,增强了数据的集成度和通用性。该研究对国家油气资源的综合利用和地学数据的整合处理具有一定的指导意义。
  3. 所属分类:其它

    • 发布日期:2020-06-27
    • 文件大小:757kb
    • 提供者:weixin_38544978
  1. C#在MySQL大量数据下的高效读取、写入详解

  2. 最近由于工作的原因,经常需要对海量数据进行处理,做的数据爬虫相关,动辄千万级别的数据,单表几十个G 都是都是家常便饭。 那么主要的开发语言是C#,数据库使用的是MySQL。下面通过这篇文章我们来一起学习学习吧。
  3. 所属分类:其它

    • 发布日期:2020-09-01
    • 文件大小:73kb
    • 提供者:weixin_38508821
  1. C++算法之海量数据处理方法的总结分析

  2. 本篇文章是对海量数据处理方法进行了详细的总结与分析,需要的朋友参考下
  3. 所属分类:其它

    • 发布日期:2020-09-05
    • 文件大小:48kb
    • 提供者:weixin_38625164
  1. 海量数据处理系列之:用C++实现Bitmap算法

  2. 本篇文章是对用C++实现Bitmap算法进行了详细的分析介绍,需要的朋友参考下
  3. 所属分类:其它

    • 发布日期:2020-09-05
    • 文件大小:52kb
    • 提供者:weixin_38744270
  1. 数据结构算法排序功能源码(用c++写的)

  2. 数据结构算法的功能实现,算法是非常重要的一门课程,包括其中的冒泡排序,快速排序,希尔排序,选择排序,堆排序,都非常重要,算法是程序的灵魂,优秀的程序在对海量数据处理时,依然保持高速计算,就需要高效的数据结构和算法支撑。
  3. 所属分类:C++

    • 发布日期:2020-09-27
    • 文件大小:6kb
    • 提供者:qq_46695047
  1. php与c 实现按行读取文件实例代码

  2. php与c 实现按行读取文件 前言 感觉很糟糕的一场电话一面竟然给了二面通知,好吧,给自己一个机会也给对方一次机会,题外话。海量数据处理经常涉及到hash将原来文件的每一行散列到子文件中,那如何按行读取文件呢,这里记录一下php和c的实现 很水的一篇,只是记录一下常用的方法,防止面试尴尬 php代码: <?php /** * 按行读取文件 * param string $filename */ function readFileByLine ($filename) { $
  3. 所属分类:其它

    • 发布日期:2020-12-18
    • 文件大小:42kb
    • 提供者:weixin_38677255
  1. C#如何在海量数据下的高效读取写入MySQL

  2. 前提 由于工作的原因,经常需要对海量数据进行处理,做的数据爬虫相关,动辄千万级别的数据,单表几十个G都是都是家常便饭。  主要开发语言是C#,数据库使用的是MySQL。 最常见的操作便是 select 读取数据,然后在C#中对数据进行处理, 完毕后再插入数据库中。  简而言之就 select -> process -> insert三个步骤。 对于数据量小的情况下(百万级别 or 几百兆)可能最多1个小时就处理完了。但是对于千万级数据可能几天,甚至更多。 那么问题来了,如何优化?
  3. 所属分类:其它

    • 发布日期:2020-12-15
    • 文件大小:131kb
    • 提供者:weixin_38673812
  1. 海量数据处理系列之:用C++实现Bitmap算法

  2. bitmap是一个十分有用的结构。所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。 适用范围:可进行数据的快速查找,判重,删除,一般来说数据范围是int的10倍以下基本原理及要点:使用bit数组来表示某些元素是否存在,比如8位电话号码扩展:bloom filter可以看做是对bit-map的扩展问题实例:1)已知某个文件内包含一些电话号码,每个号码为8位数字,统计不同号码的个数。8位最
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:57kb
    • 提供者:weixin_38694299
  1. C++算法之海量数据处理方法的总结分析

  2. 海量数据处理中常用到的技术 1. Bloom Filtering基本的Bloom Filtering支持快速的插入和查找操作,是一种hash表技术。基本的数据结构非常简单,容量为m的位数组,k个hash函数,将输入的n个元素存储在位数组里面。每次插入一个新的元素,先计算该元素的k个hash指,将位数组对应hash值位置为1. 查找某个元素时,同样的先计算k个hash值,然后查询看是否对应位数组中得k位是否都是1,是则断定元素存在。基本的Bloom Filtering算法可以用于允许误差的快速判重
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:54kb
    • 提供者:weixin_38659374
  1. waterdrop:生产环境的海量数据计算产品,文档地址:-源码

  2. 水滴 非常易用是一个非常易用,高性能,支持实时流式和离线批处理的海量数据处理产品,架构于Apache Spark和Apache Flink之上。 如果您没时间看以下内容,请直接进入正题: 请点击进入快速入门: : Waterdrop提供可直接执行的功能,没有必要的自行编译源代码,下载地址: : 文档地址: : 各种线上应用案例,请见: ://interestinglab.github.io/waterdrop-docs/#/zh-cn/v1/case_study/ 如果您遇到任
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:449kb
    • 提供者:weixin_42165980
  1. C#在MySQL海量数据下的高效读取、写入

  2. 前提   由于工作的原因,经常需要对海量数据进行处理,做的数据爬虫相关,动辄千万级别的数据,单表几十个G都是都是家常便饭。  主要开发语言是C#,数据库使用的是MySQL。   常见的操作便是 select 读取数据,然后在C#中对数据进行处理, 完毕后再插入数据库中。  简而言之 select -> process -> insert三个步骤。 对于数据量小的情况下(百万级别 or 几百兆)可能   多1个小时处理完了。但是对于千万级数据可能几天,甚至更多。 那么问题来了,如
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:72kb
    • 提供者:weixin_38656989
« 12 3 4 5 6 »