您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据分析——RDBMS与MapReduce的竞争与共生

  2. 在科学研究、计算机仿真、互联网应用、电子商务等诸多应用领域,数据量正在以极快的速度增长,为了分析和利用这些庞大的数据资源,必须依赖有效的数据分析技术.传统的关系数据管理技术(并行数据库)经过了将近40 年的发展,在扩展性方面遇到了巨大的障碍,无法胜任大数据分析的任务;而以MapReduce 为代表的非关系数据管理和分析技术异军突起,以其良好的扩展性、容错性和大规模并行处理的优势,从互联网信息搜索领域开始,进而在数据分析的诸多领域和关系数据管理技术展开了竞争.关系数据管理技术阵营在丧失搜索这个阵
  3. 所属分类:专业指导

    • 发布日期:2012-04-08
    • 文件大小:409kb
    • 提供者:frogprinceliu
  1. 云计算系统架构文档 下

  2. 云计算系统架构文档 下 一路前行——Autodesk中国研发中心Scrum故事(李丁山).pdf 为社交网站构建新型数据产品(John Wang).pdf 云应用集成的N种成功模式(Richard).pdf 人人网开放平台验证与授权方面实践.pdf 使用Chef和Cucumber进行行为(测试)驱动基础设施开发(Sai).pdf 利用同步数据复制最大化数据库的使用效率(Schooner).pdf 又拍网架构中的消息,任务系统(赵钟秋).pdf 国家级基础信息库交换系统架构设计(潘雪梅).pdf
  3. 所属分类:电子商务

    • 发布日期:2013-09-16
    • 文件大小:46mb
    • 提供者:machen_smiling
  1. NLPIR大数据搜索与挖掘共享开发平台

  2. 一、简介 NLPIR文本搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。 NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处
  3. 所属分类:C/C++

    • 发布日期:2014-10-24
    • 文件大小:40mb
    • 提供者:u012548562
  1. 国家通信工程师(互联网)培训讲义

  2. 第一章 数据通信基础 1.解释数据传输速率所使用的3种不同的定义的主要内容 码元速率:每秒传输的码元数,又称波特率单位为DB,如码元持续时间为T(S),则码元速率为NBD=1/t(s) 数据传信速率:每秒传输二进制码的速率,又称比特率,单位为比特/秒(bit/s) 数据传送速率:单位时间内在数据传输系统中的相应设备之间实际传送的比特,字符或码组平均数,单位为比特/秒,字符/秒或码组/秒 2.常用的信号复用方法有哪些 按时间区分信号的复用方法为时分复用TDM,按空间分为空分复用SDM,按频率或波
  3. 所属分类:软考等考

    • 发布日期:2015-07-09
    • 文件大小:886kb
    • 提供者:njupt1314
  1. 大数据日知录(1/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:50mb
    • 提供者:thirdlucky
  1. 大数据日知录(2/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:17mb
    • 提供者:thirdlucky
  1. 2016大数据技术大会

  2. 2016大数据技术大会,来自一线互联网(含bat)厂商顶级大学的大数据实践经验, 包含以下主题: ​百度大规模推荐系统实践 京东数据库备份系统进化之路​ ​腾讯大数据能力输出之路 基于图算法的跨设备受众识别 ​360聚效广告大数据平台实践​ ​领域知识驱动的个性化推荐方法 大数据基础组建的安全解决方案 ​大数据视野下的数据安全防护体系探索​大数据安全防护​ ARM嵌入式系统的DNN性能优化 ​Gemini:基于图计算的高性能大数据分析系统 ​下一代实时数据处理引擎——Apache Apex项目
  3. 所属分类:专业指导

    • 发布日期:2017-03-09
    • 文件大小:75mb
    • 提供者:dreamfarwhb
  1. 大数据-日知录-架构-算法(PDF高清完整版)

  2. 内容简介 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件 体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-23
    • 文件大小:67mb
    • 提供者:sbliu_rsgs
  1. 大数据日知录——架构与算法

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:算法与数据结构

    • 发布日期:2018-04-12
    • 文件大小:67mb
    • 提供者:yh3000
  1. 位置大数据的价值提取与协同挖掘方法

  2. 随着位置服务和车联网应用的不断普及,由地理数据、车辆轨迹和应用记录等所构成的位置大数据已成为当前用来感知人类社群活动规律、分析地理国情和构建智慧城市的重要战略性资源,是大数据科学研究极其重要的一部分.与传统小样统计不同,大规模位置数据存在明显的混杂性、复杂性和稀疏性,需要对其进行价值提取和协同挖掘,才能获得更为准确的移动行为模式和区域局部特征,从而还原和生成满足关联应用分析的整体数据模型.因此,着重从以下3个方面系统综述了针对位置大数据的分析方法,包括:(1)针对数据混杂性,如何先从局部提取出
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. 国科大大数据系统与大规模数据分析18-19春季.rar

  2. 随着互联网、社交网络、云计算、物联网、移动计算、大规模科学探测与计算分析等的发展,各种新的数据密集型应用如雨后春笋般涌现。这些新的应用通常具有数据量巨大、数据获取速度更新速度快和/或数据种类丰富繁多等特点,被通称为大数据应用。近年来,产业界和学术界面向不同应用场景推出了多种类型、各具特色的大数据处理系统平台。同时,一大批数据建模与分析的方法被应用于大规模数据处理。一方面,多种大数据处理平台没有统一的标准,设计目标、功能和关键技术也多有不同,对于初学者的学习带来了很大的困难,容易“只见树木不见森
  3. 所属分类:讲义

    • 发布日期:2019-08-01
    • 文件大小:30mb
    • 提供者:bozitong1996
  1. 大数据系统与大规模数据分析18-19春季.rar

  2. 随着互联网、社交网络、云计算、物联网、移动计算、大规模科学探测与计算分析等的发展,各种新的数据密集型应用如雨后春笋般涌现。这些新的应用通常具有数据量巨大、数据获取速度更新速度快和/或数据种类丰富繁多等特点,被通称为大数据应用。近年来,产业界和学术界面向不同应用场景推出了多种类型、各具特色的大数据处理系统平台。同时,一大批数据建模与分析的方法被应用于大规模数据处理。一方面,多种大数据处理平台没有统一的标准,设计目标、功能和关键技术也多有不同,对于初学者的学习带来了很大的困难,容易“只见树木不见森林
  3. 所属分类:讲义

    • 发布日期:2020-02-20
    • 文件大小:30mb
    • 提供者:yjreset
  1. ArcGIS的大数据利器.pdf

  2. 介绍时空大数据特点,ArcGIS的大数据工具使用,相关案例、时空大数据的特点 esr China BEJJINS 大数据 PEAK OF INFLATED EXPECTATIONS PLATEAU OF >技术关注度 过高期望的峰值 PRODUCTIVITY SLOPE OI实质生产的高峰期 ENLIGHTENMENT 稳步爬升的光明期 TROUGH OF DISILLUSIONMENT 泡沫化的底谷期 TECHNOLOGY TRIGGER 科技诞生的促动期 MATURITY技术成熟度
  3. 所属分类:Hadoop

    • 发布日期:2019-08-18
    • 文件大小:7mb
    • 提供者:tozhangjl
  1. 大数据市场年度综合报告.pdf

  2. 大数据市场年度综合报告.pdf中国大数据市场年度综合报告2016 2016年8月 易观发现 国家大数据发展相关政策密集出台 《促进大数据发展行动纲要》中指出,我国现代信息化进程中产生的和可被利用的海量数据集合, 是当代信息社会的数捱资源总和,是信息吋代的全数拆,既包括互联网数据,也包括政府数据和行业 数据。经过多年发展,传统信息化对经济社会发展的支撑和引领作为无法充分发挥,迫切需要打破部 门割据和行业壁垒,促进互联冮通、数据开放、信息共享和业务协同,切实以数据流引领技术流、物 质流、资金沇、人才
  3. 所属分类:互联网

    • 发布日期:2019-07-03
    • 文件大小:9mb
    • 提供者:qq_34543438
  1. Vertica实时数据分析平台

  2. 深度介绍Vertica产品总体架构、核心优势、集群能力、Vertica与Hadoop的数据交换、SQL高级分析、与分布式R无缝集成、灾备能力等等,是不可多得的了解Vertica的好资料。数据分析平台演进阶段及挑战 事件触发,全量数据实时分析频 价值实 业务相关性分析 繁访问 产品分析、用户行为分析客客户活动预测,客户流失预测,直接提升业务 户分析等灵活直询和数据分析产品盈利预测 面向大量业务人员 MOLAP CUBE生成 面向少量管理者的机器学习和 现整合层行业模型批量加工 预测 监管报送等数据
  3. 所属分类:Hadoop

    • 发布日期:2019-04-20
    • 文件大小:4mb
    • 提供者:skyon
  1. 大数据日知录.mmap

  2. 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统
  3. 所属分类:算法与数据结构

  1. 大数据处理平台比较与分析

  2. 虽然以MapReduce和Hadoop分布式系统(HDFS)为核心的Hadoop已在大规模数据密集的商业领域成功应用,但是对于多个并行操作之间重用工作数据集却表现不佳。作为对其的一种补充,本文介绍了Spark。首先介绍Hadoop的MapReduce与HDFS基本概念与设计思想,然后介绍了Spark的基本概念与思想,并且着重介绍了弹性分布式数据集RDD,并通过实验证明和分析对比了Hadoop与Spark。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:271kb
    • 提供者:weixin_38625143
  1. glow:一个用于大规模基因组分析的开源工具包-源码

  2. 一个用于大规模基因组分析的开源工具包 ·· Glow是一个开放源代码工具包,用于在生物银行规模甚至更大范围内实现生物信息学。 易于上手 该工具包包括您立即执行最常见分析所需的构建基块: 将VCF,BGEN和Plink文件加载到分布式DataFrame中 使用内置功能执行质量控制和数据处理 变体归一化和liftOver 进行全基因组关联研究 与Spark ML库集成以进行人口分层 并行化命令行工具以扩展现有工作流程 按比例建造 Glow使基因组数据与Spark协同工作,Spark是处理大型结
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:47mb
    • 提供者:weixin_42118011
  1. 大数据系统软件创新平台与生态建设

  2. 针对大数据系统软件开源生态发展现状、大数据系统软件技术与领域应用发展的迫切需求与工程化瓶颈,系统地介绍了大数据系统软件共性技术的研发思路以及大数据系统软件国家工程验室研制的“数为平台”的技术架构,包括大规模多源异构数据的一体化管理、异构数据的交互式分析框架、数据可视化与智能数据工程、大数据混源软件可信验证、领域大数据应用开发与运行环境等。给出了基于平台建设开放的大数据软件创新平台与生态的模式,并在工业制造业、气象环保服务领域开展应用示范。
  3. 所属分类:其它

« 12 3 4 5 6 7 8 »