搜索资源 - 索引去重 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 索引去重

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

ArcGIS最短路径分析代码.tar
这套软件开发目的：从始发站到目的地能够自己的程序来给出一些参考线路数据库设计： A. 车次信息车次经过的站点 //起点终点 B. 数据库导入导出去重 SQL delete from BusInfo where DataId not in ( select DataId from BusInfo as a where DataId = ( select top 1 DataId from BusInfo where BusId =a.BusId ) ) 泛型的用法； 1.派生类
所属分类：其它
- 发布日期：2009-08-27
- 文件大小：1mb
- 提供者：jianyi7659

垂直搜索引擎完全开源版 c#开发基于Lucene.net 带效果预览图片
垂直搜索引擎完全开源版 c#开发基于Lucene.net 1.前台结合Lucene的搜索引擎功能，使得数据搜索更快； 2.新增加采集功能，采集时图片下载，flash下载功能，默认配置的是南海网分类信息的采集规则； 3.该代码简洁，完全开源，可以与网博多款新闻系统无缝整合； 4.最新新闻系统已增加伪静态与全站生成静态功能。 5.支持上亿级数据的全文查询，时间在毫秒级，通常在30毫秒以下； 6.新闻系统与搜索引擎测试地址垂直搜索垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化
所属分类：C#
- 发布日期：2010-10-07
- 文件大小：5mb
- 提供者：cheqiyolin

K风网页搜索系统(.NET) v2.2 源码
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度； V2.1版本主要改
所属分类：C#
- 发布日期：2010-10-31
- 文件大小：2mb
- 提供者：yuanhongcs

自己动手写搜索引擎(罗刚著).doc
自己动手写搜索引擎 1 第1章了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境（10分钟） 5 2.1.2 编写代码（15分钟） 6 2.1.3 发布运行（5分钟） 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
所属分类：其它
- 发布日期：2011-04-18
- 文件大小：6mb
- 提供者：qq736655941

ORACLE重建索引总结
一、重建索引的前提 1、表上频繁发生update,delete操作； 2、表上发生了alter table ..move操作（move操作导致了rowid变化）。二、重建索引的标准 1、索引重建是否有必要，一般看索引是否倾斜的严重，是否浪费了空间，那应该如何才可以判断索引是否倾斜的严重，是否浪费了空间，对索引进行结构分析（如下）： SQL>Analyze index index_name validate structure; 2、在执行步骤1的session中查询index_st
所属分类：Oracle
- 发布日期：2011-12-13
- 文件大小：21kb
- 提供者：yinchuang_huang

自己动手写搜索引擎.pdf
对网络爬虫、网页去重、建立索引及信息检索都有描述，对初学者有引导作用
所属分类：其它
- 发布日期：2012-03-08
- 文件大小：3mb
- 提供者：yuanhangzhe

索引文件去重
索引文件去重
所属分类：Web开发
- 发布日期：2012-04-24
- 文件大小：19mb
- 提供者：goldfish0328

自己动手写搜索引擎(罗刚)
自己动手写搜索引擎 1 第1章了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境（10分钟） 5 2.1.2 编写代码（15分钟） 6 2.1.3 发布运行（5分钟） 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
所属分类：Java
- 发布日期：2012-04-25
- 文件大小：3mb
- 提供者：jayghost

这就是搜索引擎：核心技术详解.pdf
搜索引擎作为互联网发展中至关重要的一种应用，已经成为互联网各个领域的制高点，其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域，搜索引擎各个子系统是如何设计的？这成为广大技术人员和搜索引擎优化人员密切关注的内容。本书的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍，除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外，还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术，同时
所属分类：互联网
- 发布日期：2012-05-16
- 文件大小：2mb
- 提供者：xieleri

这就是搜索引擎-核心技术详解
内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍，除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外，还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术，同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。
所属分类：互联网
- 发布日期：2012-10-02
- 文件大小：7mb
- 提供者：fengyulucky

这就是搜索引擎：核心技术详解
内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍，除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外，还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术，同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。
所属分类：互联网
- 发布日期：2012-10-02
- 文件大小：2mb
- 提供者：fengyulucky

开源webspider网络蜘蛛
稳定的网络蜘蛛，可以并行抓取多个站点，BS架构控制系统，使用httpsqs 和淘宝的tair可以作为分布式爬虫基础，去重能力强，存储系统为mysql，可以用sphinx等做索引
所属分类：C
- 发布日期：2012-12-30
- 文件大小：57kb
- 提供者：lsdyst

网络蜘蛛webspider开源系统
稳定的网络蜘蛛，可以并行抓取多个站点，BS架构控制系统，使用httpsqs 和淘宝的tair可以作为分布式爬虫基础，去重能力强，存储系统为mysql，可以用sphinx等做索引，原始版本
所属分类：C++
- 发布日期：2012-12-30
- 文件大小：14kb
- 提供者：lsdyst

开源webspider网络蜘蛛webspider-1.0.0.6.tar.gz
稳定的网络蜘蛛，可以并行抓取多个站点，BS架构控制系统，使用httpsqs 和淘宝的tair可以作为分布式爬虫基础，去重能力强，存储系统为mysql，可以用sphinx等做索引
所属分类：C++
- 发布日期：2012-12-30
- 文件大小：41kb
- 提供者：lsdyst

webspider-1.0.0.5.tar.gz
稳定的网络蜘蛛，可以并行抓取多个站点，BS架构控制系统，使用httpsqs 和淘宝的tair可以作为分布式爬虫基础，去重能力强，存储系统为mysql，可以用sphinx等做索引
所属分类：C
- 发布日期：2012-12-30
- 文件大小：55kb
- 提供者：lsdyst

面向美食网站的搜索及点评与图片去重模块的设计与实现
本课题所研究的内容是某美食类网站关于图片，内容的处理以及垂直搜索的问题。对于图片处理，简单来说是图片的匹配，采用匹配算法过滤出重复的图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图片信息，使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计算图片的相似度数据来实现。内容处理问题即点评处理，该问题与图片处理类似，通过中文分词算法对点评内容进行分词，然后根据规则对待匹配的内容进行排序，最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进行专项搜索，
所属分类：PHP
- 发布日期：2014-09-14
- 文件大小：1mb
- 提供者：zhoutao1993allen

MySQL中索引优化distinct语句及distinct的多字段操作
主要介绍了MySQL中索引优化distinct语句及distinct的多字段操作方法,distinct语句去重功能的使用是MySQL入门学习中的基础知识,需要的朋友可以参考下
所属分类：其它
- 发布日期：2020-09-10
- 文件大小：51kb
- 提供者：weixin_38681646

MySQL去重该使用distinct还是group by？
前言关于group by 与distinct 性能对比:网上结论如下，不走索引少量数据distinct性能更好，大数据量group by 性能好，走索引group by性能好。走索引时分组种类少distinct快。关于网上的结论做一次验证。准备阶段屏蔽查询缓存查看MySQL中是否设置了查询缓存。为了不影响测试结果，需要关闭查询缓存。 show variables like '%query_cache%'; 查看是否开启查询缓存决定于query_cache_type和query_cach
所属分类：其它
- 发布日期：2020-12-14
- 文件大小：255kb
- 提供者：weixin_38503448

python列表list保留顺序去重的实例
常规通过迭代或set方法，都无法保证去重后的顺序问题如下,我们可以通过列表的索引功能，对set结果进行序列化 old_list=["a",1,"b","a","b",2,5,1] new_list=list(set(old_list)) print new_list #['a', 1, 2, 'b', 5] new_list.sort(key=old_list.index) print new_list #['a', 1, 'b', 2, 5] 以上这篇python列表list保留顺序去重的
所属分类：其它
- 发布日期：2020-12-25
- 文件大小：30kb
- 提供者：weixin_38689191

Pandas 数据框增、删、改、查、去重、抽样基本操作方法
总括 pandas的索引函数主要有三种： loc 标签索引，行和列的名称 iloc 整型索引（绝对位置索引），绝对意义上的几行几列，起始索引为0 ix 是 iloc 和 loc的合体 at是loc的快捷方式 iat是iloc的快捷方式建立测试数据集： import pandas as pd df = pd.DataFrame({'a': [1, 2, 3], 'b': ['a', 'b', 'c'],'c': [A,B,C]}) print(df) a b c 0 1 a A 1 2 b
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：60kb
- 提供者：weixin_38645133

« 12 3 4 5 6 7 8 »