您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 布隆过滤器之C++实现

  2. C++实现的布隆过滤器,其中使用到的bitset也是自己简单实现的一个BitContainer。可以处理千万条到亿条记录的存在性判断。做成dll可以在很多场合使用,如自己写爬虫,要判断一个url是否已经访问过,判断一个单词是否在某个字典内,当集合很大的时候,用布隆过滤器很有优势,不过使用前,请了解它的优缺点(缺点是有一定的误判率)
  3. 所属分类:C++

    • 发布日期:2011-11-20
    • 文件大小:2kb
    • 提供者:jdpdnc
  1. 转载:布隆过滤器算法

  2. 下面是一个简单的布隆过滤器的C/C++实现,以及使用例程。使用sdbmhash字符串hash方法来进行hash。
  3. 所属分类:C/C++

    • 发布日期:2011-12-29
    • 文件大小:4kb
    • 提供者:lijin_1234
  1. 中文文本分类实验

  2. 中文文本分类完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错
  3. 所属分类:互联网

    • 发布日期:2012-05-17
    • 文件大小:383kb
    • 提供者:palydawn
  1. 布隆过滤器

  2. 用C++实现了简单的布隆过滤器,含有源码,适合新手学习用
  3. 所属分类:C++

    • 发布日期:2012-12-17
    • 文件大小:1mb
    • 提供者:flash123987
  1. 自己动手写网络爬虫 PDF

  2. 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬
  3. 所属分类:Java

    • 发布日期:2013-07-12
    • 文件大小:25mb
    • 提供者:xianchen1122
  1. 自己动手写网络爬虫

  2. 完整版《自己动手写网络爬虫》! 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2
  3. 所属分类:专业指导

    • 发布日期:2013-10-27
    • 文件大小:27mb
    • 提供者:qq674708957
  1. nosql 入门教程

  2. 第一部分  NoSQL入门 第1章  NoSQL的概念及适用范围 2 1.1  定义和介绍 3 1.1.1  背景与历史 3 1.1.2  大数据 5 1.1.3  可扩展性 7 1.1.4  MapReduce 8 1.2  面向列的有序存储 9 1.3  键/值存储 11 1.4  文档数据库 14 1.5  图形数据库 15 1.6  小结 16 第2章  NoSQL上手初体验 17 2.1  第一印象——两个简单的例子 17 2.1.1  简单的位置偏好数据集 17 2.1.2  存储
  3. 所属分类:MySQL

    • 发布日期:2017-10-25
    • 文件大小:15mb
    • 提供者:u012296096
  1. 布隆过滤器的实现,以及测试用例,简单易懂并做了一些注释

  2. 布隆过滤器的简单实现,从谷歌的levelDB摘取过来,做了源码的注释很好理解
  3. 所属分类:其它

    • 发布日期:2018-04-08
    • 文件大小:328kb
    • 提供者:li775085737
  1. C++网络爬虫项目

  2. WEBCRAWLER 网络爬虫实训项目 1 WEBCRAWLER 网 络 爬 虫 实 训 项 目 文档版本: 1.0.0.1 编写单位: 达内IT培训集团 C++教学研发部 编写人员: 闵卫 定稿日期: 2015年11月20日 星期五WEBCRAWLER 网络爬虫实训项目 2 1. 项目概述 互联网产品形形色色,有产品导向的,有营销导向的,也有技术导向的,但是 以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中最具技 术含量的产品,如果不是唯一,至少也是其中之一。 经过十几年的发展
  3. 所属分类:C/C++

    • 发布日期:2018-07-04
    • 文件大小:4mb
    • 提供者:qq15690515
  1. Solidity官方文档中文版.pdf

  2. Solidity 是一种语法类似 Javascr ipt 的高级语言。它被设计成以编译的方式生成以太坊虚拟机代码。在后续内容中你将会发现,使用它很容易创建用于投票、众筹、封闭拍卖、多重签名钱包等等的合约。汇智网 Hu biz. com Solidity官方文档中文版 Browser-Based Compiler Changelog Story Backlog. Source code Gitter Chat Solidity文档 在下一章中,我们先看一个用 Solidity写的简单的智能合约,然
  3. 所属分类:以太坊

  1. 简单实现的布隆过滤器

  2. 自动清空过滤器内部信息的使用比率,传null则表示不会自动清理,当过滤器使用率达到100%时,则无论传入什么数据,都会认为在数据已经存在了当希望过滤器使用率达到80%时自动清空重新使用,则传入0.8
  3. 所属分类:Java

  1. Redis 中的布隆过滤器的实现

  2. 什么是『布隆过滤器』 布隆过滤器是一个神奇的数据结构,可以用来判断一个元素是否在一个集合中。很常用的一个功能是用来去重。在爬虫中常见的一个需求:目标网站 URL 千千万,怎么判断某个 URL 爬虫是否宠幸过?简单点可以爬虫每采集过一个 URL,就把这个 URL 存入数据库中,每次一个新的 URL 过来就到数据库查询下是否访问过。 select id from table where url = 'https://jaychen.cc' 但是随着爬虫爬过的 URL 越来越多,每次请求前都要访问数
  3. 所属分类:其它

    • 发布日期:2020-12-16
    • 文件大小:101kb
    • 提供者:weixin_38661087
  1. Redis 中的布隆过滤器的实现

  2. 什么是『布隆过滤器』 布隆过滤器是一个神奇的数据结构,可以用来判断一个元素是否在一个集合中。很常用的一个功能是用来去重。在爬虫中常见的一个需求:目标网站 URL 千千万,怎么判断某个 URL 爬虫是否宠幸过?简单点可以爬虫每采集过一个 URL,就把这个 URL 存入数据库中,每次一个新的 URL 过来就到数据库查询下是否访问过。 select id from table where url = 'https://jaychen.cc' 但是随着爬虫爬过的 URL 越来越多,每次请求前都要访问数
  3. 所属分类:其它

    • 发布日期:2020-12-16
    • 文件大小:101kb
    • 提供者:weixin_38577200
  1. redis各种应用

  2. 文章目录redis可以做什么异步消息队列分布式锁冲突处理延时队列的实现位图HyperLogLog布隆过滤器简单限流-滑动窗口漏斗限流大海捞针scankeys reg缺点scan特点scan基本使用 redis可以做什么 记录帖子的点赞数,评论数,点击数 记录用户帖子id列表,便于快速显示用户的帖子列表 记录帖子的标题,摘要,作者和封面信息,用于列表页显示 记录帖子的点赞用户id列表,评论id列表,用于显示和去重计数 缓存近期热帖内容,减少数据库压力 如果帖子ID是自增的,使用redis分配帖子I
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:80kb
    • 提供者:weixin_38690522
  1. Algorithms-Open-Source:每个技能水平都有一个任务!-源码

  2. 开源算法 该项目是各种编程语言中各种算法的实现的集合。 这些算法非常有用且相对简单,建议任何计算机科学专业的学生都可以实施。 动机 此项目的动机是此 想要贡献? 看看 选择您要处理的问题 用选择的语言发表评论,之后您将被分配到该问题。 只有这样才能开始处理任务。 如果您选择的算法已经实现,请尝试对其进行优化。 如果当前尚不存在自述文件,请确保将其添加到自述文件中。 注意:鼓励以不同的语言实现已经实现的算法。 项目结构 回购的结构类似于 算法类别 算法名称 语言实现-源代码 当前实施的算法
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:135kb
    • 提供者:weixin_42122838
  1. 布隆过滤器+CBF scala实现+代码详解

  2. 文章目录简介BloomFilterBloomFilter的简单优化改进BloomFilterspark 的布隆过滤器scala实现BF、CBF 简介 布隆过滤器可以说是在大数据的处理算法方面经常使用的基础算法。 在这方面我看了很多的博客,确实看到了很多很详细的解释和总结,但是都是零散的,没有很全面的在原理和实现,以及实现代码的解析等方面做的很全面的。所以我将我自己整理的东西很完整的和大家分享。 其中在实际的使用和实现方面,我会增加spark的实现,以及scala的BF和CBF的两个简单的demo
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:111kb
    • 提供者:weixin_38612437