您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. HBase Coprocessor 优化与实验

  2. 在hbtc2012上的发言,介绍hbase coprocessor的优化。hbase的cp是其自带的分布式并行计算框架。
  3. 所属分类:其它

    • 发布日期:2012-12-05
    • 文件大小:1048576
    • 提供者:ltguo
  1. 吴朱华:中小企业Big Data解决之道

  2. 吴朱华发表题为“海量数据从'小'做起 中小企业Big Data解决之道”的主题演讲。他表示海量数据呈现“4V + 1C”的特点。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:941056
    • 提供者:hehaihe220
  1. Eric Baldeschwieler:Hadoop Present and Future

  2. Hortonworks的首席技术官Eric Baldeschwieler曾是Inktomi公司Web服务引擎的技术领导者,雅虎Web搜索总设计师,雅虎Apache Hadoop项目的负责人。在他看来,如今Hadoop已经发展为一个庞大的体系,包含各类企业级应用部署。2015年,全球数据中将有一半都是通过Hadoop来处理的。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. Nikita Shamgunov:解析“实时数据分析”

  2. Nikita把如今的时代比做是摩尔定律的尾声,指出如今的计算速度不会再像以前那么快,然而数据的发展速度却丝毫没有停止,同时数据的多样性也完全爆发。他认为如今大数据技术最大的难题就是延迟问题,尤其是数据延迟和查询延迟。在对比了Twitter的Strom和Cloudera的Impala技术之后,他详细介绍了MemSQL的...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:696320
    • 提供者:fowse
  1. 潘越:从战略角度解读大数据的机遇

  2. IBM中国研究院信息管理与医疗健康首席科学家潘越阐述了大数据的4个V:大数据首先代表的是数据产生的量比传统的量大很多,他认为传统的G级别或者T级别的数据存储和管理的方案,目前看起来都不太合适或者是性价比不高。第二个V是针对机器产生的数据,传统的分析的周期原来可能都是以月、周、天这样...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 张晓东:解析并行处理在大数据分析中所面对的挑战

  2. 张晓东教授主要就并行计算在云计算和大数据的时代的挑战做了演讲。他指出我们遇到的挑战首先是数据量大,如今的应用对处理性能要求高,需求非常低的处理延迟,而这些是传统数据库系统不能做到的地方。其次的挑战是在大数据中的并行技术是一个多学科交叉的领域,需要多个方面的专家能够极限协...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:2097152
    • 提供者:fowse
  1. 朱金生:Hadoop的模式与实践

  2. 雅虎北京全球研发中心资深研发总监朱金生给我们分享了“Hadoop的模式与实践”。他介绍一下Hadoop的目前在雅虎进展。然后跟大家分享了一下自己对Hadoop的看法。他重点谈到了Hadoop在未来的发展问题,尤其是在高性能计算方面、HPC方面以及Hadoop和HPC之间的关系。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 顾费勇:海量数据搬运工——DataStream

  2. Hadoop与大数据技术大会(HadoopBigData Technology Conference 2012,HBTC 2012)于2012年11月30日-12月1日在北京新云南皇冠假日酒店隆重召开。在12月1日的主题论坛三上,网易资深工程师顾费勇为我们带来了题为《海量数据搬运工——DataStream》的主题演讲。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:970752
    • 提供者:fowse
  1. 刘立萍:百度大数据平台介绍

  2. Hadoop与大数据技术大会(Hadoop&BigData Technology Conference 2012,HBTC 2012)于2012年11月30日-12月1日在北京新云南皇冠假日酒店隆重召开。在大数据共享平台与应用主题论坛上,来自百度基础架构部数据平台技术经理刘立萍介绍了百度大数据平台。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:953344
    • 提供者:fowse
  1. Anoop Sam John:HBase的二级索引

  2. 在12月1日上午的“NoSQL & NewSQL”主题论坛上,华为高级技术经理Anoop Sam John分享了题为《HBase的二级索引》的主题演讲。他介绍了华为在实际工程中对于HBase的优化工作,并分享了华为基于开源社区建设及长期工程积累的经验。除此之外,Anoop Sam John还重点介绍了华为构建的HBase二级索引能力。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:633856
    • 提供者:fowse
  1. Ted Yu:如何在企业中应用HBase

  2. 在12月1日的NoSQL & NewSQL主题论坛上,来自HBase Committer的Ted Yu给大家分享了题为《HBase For Enterprise》的主题演讲。演讲中,Ted Yu分享了HBase的基本概况以及各版本的具体应用情况。除此之外,Ted Yu还与在场听众就有关HBase使用方面的问题进行了沟通交流。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:451584
    • 提供者:fowse
  1. 王玉法:Tair存储引擎之路

  2. 在12月1日的“NoSQL & NewSQL”主题论坛上,来自阿里巴巴集团核心系统研发高级开发工程师王玉法分享了题为《Tair存储引擎之路》的主题演讲,他首先给大家介绍了Tair存储引擎的大概情况,随后,王玉法给大家分享了Tair目前支持的三种引擎MDB、RDB以及LDB。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:832512
    • 提供者:fowse
  1. Maheshwara Rao G:HDFS NameNode的高可用性研究

  2. 在12月1日“Hadoop生态系统”主题分论坛,华为电信与核心网产品线BigData团队的架构师Uma Maheshwara Rao G,负责HDFS项目整体技术开发。对电信领域有深刻理解,从2010年起从事HDFS开发,是HDFS的核心设计人员。他的演讲主题是“HDFS Name Node高可用性分析”,通过对构建在Bookkeeper上的的HDFS Name Node高可用性,尤其是...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:963584
    • 提供者:fowse
  1. 戴建勇:解读Apache Pig的性能优化

  2. 在12月1日“Hadoop生态系统”主题分论坛,Hortonworks member of technical staff戴建勇从充分利用Combiner、构建基于规则的优化器、利用Column Pruner以及使用Push up filter等角度,在分区pruning、压缩中间文件、合并MapReduce作业和控制合并粒度等方面详细演示了如何对Apache Pig的性能进行优化。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 郭磊涛:HBase Coprocessor优化与实验

  2. 在12月1日“Hadoop生态系统”主题分论坛,中国移动研究院云计算研究员郭磊涛分享了“HBase Coprocessor优化与实验”,郭首先介绍了HBase Coprocessor框架,用实例详解了HBase Coprocessor的实现,如何对其进行配置等。之后就对其优化从Region数据本地化,CP的本地汇集等方面做了详述。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 梁李印:阿里Hadoop集群架构及服务体系

  2. 在12月1日“Hadoop生态系统”主题分论坛,阿里巴巴高级研发工程师梁李印分享了“阿里Hadoop集群架构及服务体系”。他从集群发展现状、集群服务模式及挑战、Hadoop版本特性以及集群用户门户和集群核心业务架构(三淘)这五个方面展开论述。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 刘佳:全面分析HBase用例

  2. 在12月1日“Hadoop生态系统”主题分论坛,普泽天玑技术总监刘佳发表了题为“HBase用例分析”的演讲。刘佳主要分享了3个案例:第一个是数据魔方,他从新旧系统的原理对比入手,详细介绍了他们如何对流程进行重新规划;第二个是访客直播间,从系统架构的角度深度解析了HBase的应用;最后是广点通,刘...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:2097152
    • 提供者:fowse
  1. 王琤:Hadoop Namenode性能诊断及优化

  2. 阿里集团核心系统研发部技术专家王琤向与会者分享了题为“Hadoop Namenode性能诊断及优化”的演讲,主要介绍了目前淘宝Hadoop集群在现实中遇到的NameNode性能问题。针对这些性能问题,王琤介绍淘宝进行profiling的方法、相关工具及最终定位等。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:939008
    • 提供者:fowse
  1. 赵伟:HIVE在腾讯分布式数据仓库实践

  2. 赵伟首先介绍了他们的TDW核心架构,HIVE,MapReduce,HDFS及PostgreSQL构成。赵伟分享了最核心的HIVE模块在TDW中的实践经验;HIVE是一个在Hadoop上构建数据仓库的软件,它支持通过类SQL的HQL语言对结构化数据进行操作;实现了基本的SQL功能,可扩充UDF/UDAF...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 张晓东:并行处理在大数据分析中所面对的挑战

  2. 为扫清并行处理在大数据分析中所遇到的障碍而做的系统设计和实现:协调大数据分析的用户可控制的通信机制;将数据分析和查询要求自动转化为优化分析程序的软件工具;为平衡性能、扩展性,和容错性而定制的大数据存储结构。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:2097152
    • 提供者:admin
« 12 3 »