您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第529页

« 1 2 ... .24 .25 .26 .27 .28 529.30 .31 .32 .33 .34 ... 1412 »

[kafka] 基于Kafka的多台远程服务器上的网页文件接入到本地的技术方案以及Flume+Kafka调研

说明: 第一章 需求 对方的网页文件接入到我方服务器。每个文件要知道其:网站、采集时间等。 通过消息队列将多个远程服务器上的【数据文件】源源不断的接入到本地服务器,数据文件是下载下来的网页,传输过来的时候还要带上来自的网站和下载日期等信息。 目前讨论消息队列用Kafka。 第二章 基本方案 1、我现在能想到的就是: 远程服务器编写程序, 不停读取文件的内容成为一个字符串,然后再加上来自的网站、下载日期等信息,组合成一个JSON字符串,通过调用kafka的生产者API将字符串写入Kafka。 2、JSO
<wzwdcld> 上传 | 大小:427kb

[kafka] 大数据框架Kafka调研资料共50页

说明: Kafka Kafka特性 Kafka拓扑结构 ISR(In-Sync Replica) Topics和日志 日志中的Offset 分区和消费组 消费者Pull消息的好处 工作流程 消息写入流程 等
<wzwdcld> 上传 | 大小:2mb

[Hadoop] 1500行×3000列 数据集

说明: 一个大宽表数据文件,可以用于测试数据处理类平台的可用性边界,内容是数值
<wiborgite> 上传 | 大小:136kb

[Hadoop] hadoop 安装配置说明,以及相关实验等

说明: 计算机大三大数据 方向学生 必备,大二就可以提前准备,预习预习,熟悉熟悉linux相关基本指令,大三学起来轻松一点,这里面包含整个学期的实验实践教程代码等
<whj707216853> 上传 | 大小:8mb

[算法与数据结构] 基于聚类分析的电信业务评价_庞奥

说明: 随着经营单元的细分以及电信管理要求精细化,传统业务评价方法难以适应现代化经营和管理的要求。文章在实际工作经验中总结一个基于聚类分析的经营单元的电信业务评价方法,为经营和管理工作提供依据。 关键词:聚类分析; 电信业务评价; 相关性分析;
<lurry71> 上传 | 大小:525kb

[Hbase] 阿里云大规模结构化云存储HBase架构特性解析

说明: 曹龙(封神) 阿里云技术专家、架构师 专注在大数据领域,有6年分布式引擎研发经验 先后研发上万台Hadoop、ODPS集群 先后负责阿里YARN、spark及自主研发内存计算引擎 目前为广大公共云用户提供专业的云Hadoop服务及 云HBase服务. 阿里大数据三大组件 • 云 最佳实践 • 云 部署模式 • 云 真实案例 • 云 内核特性 • 云 未来
<woai6022> 上传 | 大小:2mb

[算法与数据结构] mq消息队列 可时时发送消息

说明: mq资源。通信,消息队列,远程队列,本地队列,队列缓存等
<u013128233> 上传 | 大小:102kb

[Hadoop] hadoop2.7.2的hadoop.dll和winutils.exe

说明: windows7中安装hadoop2.7.2时所需的hadoop.dll和winutils.exe
<qq_39360803> 上传 | 大小:79kb

[Hadoop] 全国大专生大数据比赛试题

说明: 全国大专生大数据比赛试题(2017年度职业院校技能大赛 大数据技术与应用赛项赛题)
<weixin_42375197> 上传 | 大小:134kb

[算法与数据结构] 极速动车组采集器2.0版本

说明: 极速动车组采集器是一款通用型的采集器,可以满足大部分数据抓取的需要.它有如下功能特性
<dongyong87> 上传 | 大小:4mb

[Hadoop] Centos 7安装配置Hadoop生态圈CDH5版本

说明: Centos 7安装配置Hadoop生态圈CDH5版本 其中包括hadoop hbase hive spark 等组件安装
<zhangshnjiang> 上传 | 大小:8mb

[Hadoop] Elasticsearch 案例

说明: 使用Elasticsearch 开发一个简易的搜索引擎,实现数据导入、建立索引、按关键词搜索功能
<cac2020> 上传 | 大小:23kb
« 1 2 ... .24 .25 .26 .27 .28 529.30 .31 .32 .33 .34 ... 1412 »