您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 自己动手写网络爬虫(全).pdf

  2. 《自己动手写网络爬虫》介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。《自己动手写网络爬虫》在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。   《自己动手写网络爬虫》此书代码清晰,但是对初学者不太合适,因为完全没有介绍开发平台和配置环境,以及在程序中所用到的jar包,初学者的动手能力有限,使得程序很难调通,高手倒是可以挑战一下 第1章 全面剖析网络爬虫 3   1.1 抓取网页   1.1.1
  3. 所属分类:专业指导

    • 发布日期:2011-12-17
    • 文件大小:2mb
    • 提供者:usenamer
  1. 自己动手写网络爬虫 完整版

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-02-25
    • 文件大小:25mb
    • 提供者:apxar
  1. 自己动手写网络爬虫 PDF

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-07-12
    • 文件大小:25mb
    • 提供者:xianchen1122
  1. 自己动手写网络爬虫_完整版

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-09-09
    • 文件大小:25mb
    • 提供者:haobaoipv6
  1. 自己动手写网络爬虫

  2. 完整版《自己动手写网络爬虫》! 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2
  3. 所属分类:专业指导

    • 发布日期:2013-10-27
    • 文件大小:27mb
    • 提供者:qq674708957
  1. 自己动手写网络爬虫

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2015-12-25
    • 文件大小:25mb
    • 提供者:mr_boot
  1. 自己动手写网络爬虫

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2016-03-05
    • 文件大小:25mb
    • 提供者:cszhouyang
  1. nosql 入门教程

  2. 第一部分  NoSQL入门 第1章  NoSQL的概念及适用范围 2 1.1  定义和介绍 3 1.1.1  背景与历史 3 1.1.2  大数据 5 1.1.3  可扩展性 7 1.1.4  MapReduce 8 1.2  面向列的有序存储 9 1.3  键/值存储 11 1.4  文档数据库 14 1.5  图形数据库 15 1.6  小结 16 第2章  NoSQL上手初体验 17 2.1  第一印象——两个简单的例子 17 2.1.1  简单的位置偏好数据集 17 2.1.2  存储
  3. 所属分类:MySQL

    • 发布日期:2017-10-25
    • 文件大小:15mb
    • 提供者:u012296096
  1. Hbase 源码解析

  2. 主要针对那些架构师及开发人员而设计,希望他们能更好地理解大数据应用程序的部署。在这之前,你应该具备基本的Hadoop知识,包括所需组件的设置以及成功安装过Hadoop集群,我们不会在Hadoop的配置或NodeManager功能上花费时间。阅读本书的架构师不需要有一个完整的Java 知识,但必须充分了解部署章节的内容。这本书涵盖多个垂直用例,希望能够协助各个企业和初创公司。
  3. 所属分类:Java

    • 发布日期:2019-02-19
    • 文件大小:863kb
    • 提供者:u013929901
  1. 《Hadoop与大数据挖掘》配套资源【完整版】.txt

  2. 本资源是《Hadoop与大数据挖掘》配套资源【完整版】,包含源数据和代码。 本书主要分为两个部分,基础篇和挖掘实践篇。基础篇介绍了大数据相关技术:Hadoop、Hive、HBase、Pig、Spark、Oozie等。针对每个技术有每个模块与之对应,首先会对该技术的概述、内部原理等进行介绍,使读者对该技术有一个由浅入深的理解。在对原理的介绍中会进行相应的动手实践,加深对原理的理解。在每个模块的最后,会有一到两个企业案例,对这些企业案例的介绍只限于部分介绍,主要还是使用当前模块的技术来解决其中的一
  3. 所属分类:Hadoop

    • 发布日期:2019-06-03
    • 文件大小:69byte
    • 提供者:weixin_43876206
  1. HCIP-Big_Data_Developer_V2.0实验手册.pdf

  2. HCIP-Big_Data_Developer_V2.0实验手册,要求掌握Java、Linux、大数据基础知识版权所有华为技术有限公司2019。保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传 播 商标声明 A和其他华为商标均为华为技术有限公司的商标。 本文档提及的其他所有商标或注册商标,由各自的所有人拥有。 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务 或特性可能不在您的购买或
  3. 所属分类:华为认证

    • 发布日期:2019-10-08
    • 文件大小:10mb
    • 提供者:weixin_38467835
  1. 云粘合平台漫谈及代码理解初步例子

  2. NULL 博文链接:https://lokki.iteye.com/blog/1041255大规模自动化服务,及以上以下的一些名词,但大多数都只实现了简单的服务和功能部件,也未能很 好地"动态化、按需化、快速化”。而在互联网服务新阶段,云计算基础设施里,分布式海量储存、 cache、 KeyValue、 KeyList、非关系式储存、 MapReduce、 Loadbalance、CDN、 ondemand等,这些名 词是常见和普及化的。用后面介绍的名词来说要有专业方向云技术部件” “SLA服务
  3. 所属分类:其它

    • 发布日期:2019-03-23
    • 文件大小:731kb
    • 提供者:weixin_38669628
  1. HBase数据及物理模型架构及工作原理

  2. 本文来自于csdn,主要为对HBase简介,HBase数据模型及物理模型,HBase架构及工作原理。HBase是一个构建在HDFS之上的,分布式的、面向列的开源数据库HBase是GoogleBigTable的开源实现,它主要用于存储海量数据个人理解:分布式:采用分而治之的思想,比如说我们要将10个G的数据全部写入到HBase,对于这样的一个任务我们可以通过10个节点来处理(并行处理),这样可以大大的提高执行效率。面向列:一个表中是有很多行很多列,面向列的存储就是将多个列存储在一块,HBase里是
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:547kb
    • 提供者:weixin_38644168
  1. 深入理解HBase的系统架构

  2. 物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Regionserver,HBaseHMaster,ZooKeeper。其中Regionserver负责数据的读写服务。用户通过沟通Regionserver来实现对数据的访问。HBaseHMaster负责Region的分配及数据库的创建和删除等操作。ZooKeeper作为HDFS的一部分,负责维护集群的状态(某台服务器是否在线,服务器之间数据的同步操作及master的选举等)。另外,HadoopDataNode负责存
  3. 所属分类:其它

  1. Kudu架构原理

  2. kudu定位是「FastAnalyticsonFastData」,是一个既支持随机读写、又支持OLAP分析的大数据存储引擎。原数据存储于HDFS或HBase都有优缺点:直接存放于HDFS中,适合离线分析,却不利于记录级别的随机读写。直接将数据存放于HBase/Cassandra中,适合记录级别的随机读写,对离线分析却不友好。采用了Master-Slave形式的中心节点架构,管理节点被称作MasterServer,数据节点被称作TabletServer(可对比理解HBase中的RegionServ
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:890kb
    • 提供者:weixin_38557896
  1. 数据人看Feed流-架构实践

  2. Feed流:可以理解为信息流,解决的是信息生产者与信息消费者之间的信息传递问题。我们常见的Feed流场景有:1手淘,微淘提供给消费者的首页商品信息,用户关注店铺的新消息等2微信朋友圈,及时获取朋友分享的信息3微博,粉丝获取关注明星、大V的信息4头条,用户获取系统推荐的新闻、评论、八卦关于Feed流的架构设计,包括以上场景中的很多业内专家给出了相应的思考、设计和实践。本人是大数据方向出身的技术人,所在的团队参与了阿里手淘、微淘Feed流的存储层相关服务,我们的HBase/Lindorm数据存储产品
  3. 所属分类:其它

  1. HBase的架构理解

  2. 本文介绍了HBase的数据模型及HBase的架构原理,希望对你有帮助。本文作者刘啊福,来自CSDN,由火龙果软件Linda编辑、推荐。简单理解:TimeStamp:不同版本Verison的数据根据timestamp进行区分命名空间:相当于数据库regoin(Table):表rowkey(行键):决定一个人的信息,例如:name丶age丶sex列(Column):包含列族(ColumnFamily)和列限定符(ColumnQualifier列名)组成:例如C1:nameC2:age列簇:列名列簇C
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:361kb
    • 提供者:weixin_38690522
  1. HBase数据及物理模型架构及工作原理

  2. 本文来自于csdn,主要为对HBase 简介,HBase数据模型及物理模型,HBase架构及工作原理。HBase是一个构建在HDFS之上的,分布式的、面向列的开源数据库 HBase是GoogleBigTable的开源实现,它主要用于存储海量数据个人理解: 分布式:采用分而治之的思想,比如说我们要将10个G的数据全部写入到HBase,对于这样的一个任务我们可以通过10个节点来处理(并行处
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:547kb
    • 提供者:weixin_38669093
  1. 深入理解HBase的系统架构

  2. 物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Regionserver,HBase HMaster,ZooKeeper。其中Regionserver负责数据的读写服务。用户通过沟通Regionserver来实现对数据的访问。HBaseHMaster负责Region的分配及数据库的创建和删除等操作。ZooKeeper作为HDFS的一部分,负责维护集群的状态(某台服务器是否在线,服务器之间数据的同步操作及master的选举等)。另外,Ha
  3. 所属分类:其它

  1. HBase的架构理解

  2. 本文介绍了HBase的数据模型及HBase的架构原理,希望对你有帮助。 本文作者刘啊福,来自CSDN,由火龙果软件Linda编辑、推荐。 简单理解:TimeStamp:不同版本Verison的数据根据timestamp进行区分 命名空间:相当于数据库
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:361kb
    • 提供者:weixin_38668274