您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第519页

« 1 2 ... .14 .15 .16 .17 .18 519.20 .21 .22 .23 .24 ... 1412 »

[Hadoop] 基于 Hadoop 的海量小文件处理技术研究

说明: 基于 Hadoop 的海量小文件处理技术研究 ,主要工作包括两个方面: 1) 基于多层索引的小文件读写策略的研究与实现。本文根据 Hadoop 平台现 有小文件处理的思想,对海量小文件进行合并然后建立索引。其中索引结构的设 计是本文的创新点及研究重点,包括索引预处理、索引分层、索引分片等。通过 对小文件按类型进行合并,建立多层索引,并对Hadoop平台源代码进行相应改进, 海量小文件在 Hadoop 平台上耗费节点内存的问题得到解决,检索效率得到一定程 度提升、名字节点负担得到减轻、实用性也得
<bbqm2012> 上传 | 大小:3mb

[spark] IK切词jar包

说明: IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化
<lionisleo> 上传 | 大小:4mb

[算法与数据结构] openMarkov

说明: 开源工具openMarkov,国外工具,
<u010458114> 上传 | 大小:10mb

[Hive] Cloudera-JDBC-Driver-for-Impala-Install-Guide.pdf

说明: Cloudera-JDBC-Driver-for-Impala-Install-Guide.pdf 有80多页,主要介绍了Java API,实现对impala的操作
<hbedw> 上传 | 大小:656kb

[算法与数据结构] Monitoring ElasticSearch.pdf

说明: Monitoring ElasticSearch.pdf 180页,英文原版书,需要英文阅读基础,提供给需要的人。
<hbedw> 上传 | 大小:9mb

[算法与数据结构] Mastering ElasticSearch.pdf

说明: Mastering ElasticSearch 386页,英文原版书,需要英文阅读基础,提供给需要的人。
<hbedw> 上传 | 大小:24mb

[算法与数据结构] Kibana Essentials(英文原版).pdf

说明: 303页 英文原版,需要英文阅读基础,最近做项目参考过,提供给需要的人。
<hbedw> 上传 | 大小:12mb

[flink] 一种数据流结构处理方法—Flink(2371页)

说明: 通过2371页的ppt,介绍一种数据流处理的开源工具—Flink.
<smabccba> 上传 | 大小:80mb

[Hadoop] 大数据推荐系统编程实现

说明: 大数据推荐系统的代码实现,包括文档和代码 python 语言 svm
<weixin_38399577> 上传 | 大小:1mb

[spark] python基础练习(100题)

说明: 能做出这100道题的同学,基础非常过关!字符串,字符串相关函数表,字典,字典相关运算
<weixin_39919784> 上传 | 大小:19kb

[Hadoop] centos7.4下离线安装CDH5.14

说明: 一步一步详细解析centos7.4下离线安装CDH5.14 一步一步详细解析centos7.4下离线安装CDH5.14 一步一步详细解析centos7.4下离线安装CDH5.14
<lm19770429> 上传 | 大小:845kb

[Hadoop] hadoop eclipse mapreduce 下开发所有需要用到的 JAR 包

说明: hadoop eclipse mapreduce 下开发所有需要用到的 JAR 包。 hadoop eclipse 下进行mapreduce开发所有需要用到的JAR包 mapreduce
<xmt1139057136> 上传 | 大小:61mb
« 1 2 ... .14 .15 .16 .17 .18 519.20 .21 .22 .23 .24 ... 1412 »