您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜索引擎 原理、技术与系统.pdf

  2. 内容简介 本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书
  3. 所属分类:Web开发

    • 发布日期:2009-07-23
    • 文件大小:3145728
    • 提供者:doll_paul
  1. 搜索引擎原理、技术与系统.pdf

  2. 《搜索引擎:原理技术与系统》可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资料,对广大从事网络技术、Web站点的管理、数字图书馆、Web挖掘等研究和应用开发的科技人员也有很高的参考价值。
  3. 所属分类:Web开发

    • 发布日期:2009-11-06
    • 文件大小:3145728
    • 提供者:shrimp1985
  1. 网页抓取工具metastudio

  2. MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。 metastudio是MetaSeeker工具包中的一个,具体参看安装手册。
  3. 所属分类:Web开发

    • 发布日期:2009-12-17
    • 文件大小:491520
    • 提供者:tigersz
  1. datascraper

  2. DataScraper应用领域: 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量抓取网页数据,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地抓取网页数据,输出富含语义元数据的XML格式的抓取结果文件,确保自动化的数据集成和
  3. 所属分类:Web开发

    • 发布日期:2009-12-19
    • 文件大小:173056
    • 提供者:tigersz
  1. Web网页抓取/页面信息提取软件包MetaSeeker组件datascraper中文版

  2. MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。 DataScraper:是Web页面信息提取(网页抓取/抽取)工具,利用MetaStudio生成的各种
  3. 所属分类:Web开发

    • 发布日期:2010-01-06
    • 文件大小:173056
    • 提供者:tigersz
  1. Web网页抓取/页面信息提取软件包MetaSeeker组件metastudio中文版

  2. MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。 MetaStudio是Web页面信息结构描述工具,提供GUI界面,作为Firefox扩展(Firefo
  3. 所属分类:Web开发

    • 发布日期:2010-01-06
    • 文件大小:491520
    • 提供者:tigersz
  1. 应用Web挖掘的主题元搜索引擎的设计与实现

  2. 本论文介绍了应用Web数据挖掘,基于开源搜索引擎Nutch 0.9及相关软件包,结合主题搜索引擎和元搜索引擎的特点,设计和实现一个主题元搜索引擎TSMSE,借以改善通用全文搜索引擎的查全率和查准率。 论文首先开发了主题提取器TopicDistiller,应用Web内容挖掘和Web链接分析,从通用搜索引擎检索结果网页集中提取主题词集和种子站点用于主题表示,为后续主题元搜索引擎的主题判断和主题度计算提供了依据。 论文接着提出了具有独立数据库的主题元搜索引擎TSMSE的设计思想,将元搜索引擎综合各个
  3. 所属分类:Web开发

    • 发布日期:2010-01-10
    • 文件大小:4194304
    • 提供者:yangdanbo1975
  1. 搜索引擎-原理、技术与系统.pdf

  2. 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资
  3. 所属分类:Web开发

    • 发布日期:2010-01-27
    • 文件大小:3145728
    • 提供者:terryhuang
  1. 搜索引擎-原理、技术与系统.pdf

  2. 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索 引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类 等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的 实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等 专业的研究生或高年级本科生的教学参
  3. 所属分类:Web开发

    • 发布日期:2010-01-29
    • 文件大小:3145728
    • 提供者:lm3478
  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17825792
    • 提供者:lingjoin
  1. 网络爬虫在 Web 信息搜索与数据挖掘中应用

  2. 分析了万维网不良网络信息对网络文化安全带来的挑战, 提出了Web信息搜索与数据挖掘体系结构, 并介绍了该体系结构中的关键技术和运行原理。分析了普通爬虫所实现的功能和不足之后,重点论述了该爬虫的工作原理、实现方式和性能分析以及该爬虫不同于其它爬虫的功能和在 Web 信息搜索与数据挖掘体系中应用。通过试验测试表明, 该爬虫能够很好地获取万维网上的各种信息资源, 有助于网络文化内容监测与管理。
  3. 所属分类:网络基础

    • 发布日期:2010-09-16
    • 文件大小:468992
    • 提供者:yerida
  1. 搜索引擎-原理 、技术与系统

  2. 搜索引擎 原理 搜索 算法 数据挖掘 搜索引擎 原理 搜索 算法 数据挖掘 搜索引擎 原理 搜索 算法 数据挖掘 搜索引擎 原理 搜索 算法 数据挖掘
  3. 所属分类:专业指导

    • 发布日期:2011-06-12
    • 文件大小:3145728
    • 提供者:ustcxcl
  1. datascraper

  2. DataScraper应用领域: 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量抓取网页数据,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地抓取网页数据,输出富含语义元数据的XML格式的抓取结果文件,确保自动化的数据集成和
  3. 所属分类:其它

    • 发布日期:2012-02-07
    • 文件大小:173056
    • 提供者:dd359851405
  1. NLPIR大数据搜索与挖掘共享开发平台

  2. 一、简介 NLPIR文本搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。 NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处
  3. 所属分类:C/C++

    • 发布日期:2014-10-24
    • 文件大小:41943040
    • 提供者:u012548562
  1. Web数据挖掘

  2.   过去几十年里,web的迅速发展使其成为世界上规模最大的公共数据源。web挖掘的目标是从web超链接、网页内容和使用日志中探寻有用的信息。.    本书旨在阐述web数据挖掘的概念及其核心算法,使读者获得相对完整的关于web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一
  3. 所属分类:Web开发

    • 发布日期:2014-12-05
    • 文件大小:50331648
    • 提供者:xudeli6a
  1. Web数据挖掘_Liu.B(中文版)

  2. 《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。 《Web数据挖掘》尽管题为“Web数据挖掘”,却依然涵盖了数据挖掘和
  3. 所属分类:网络基础

    • 发布日期:2017-03-01
    • 文件大小:50331648
    • 提供者:ymjrwys
  1. Web数据挖掘.pdf-中文-目录

  2. 《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-04-11
    • 文件大小:48234496
    • 提供者:c010chenxu010
  1. coreseek-4.1-win64支持多拼音全文搜索索引

  2. 全文搜索coreseek+sphinx支持拼音搜索,Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。我们不仅可以免费下载使用,也可以对其提供的源代码进行修改,使其更符合我们的搜索要求。
  3. 所属分类:MySQL

    • 发布日期:2020-02-15
    • 文件大小:10485760
    • 提供者:zhwjh
  1. 【官网上传版】QuestMobile中国移动互联网全景生态流量洞察报告:红利枯竭挖掘增长三大流派正式形成,你看好哪个?.pdf

  2. QuestMobile中国移动互联网全景生态流量洞察报告;中国移动互联网全景流量概况截止4月份,中国移动互联网月活跃用户规模达到1136亿,同比 QUESTMOBILE 增速达3.1%,首次出现连续两个月环比下跌的情况 中国移动互联网月活跃用户规模趋势 月活跃用户规模—一同比增长率 单位:亿 年全年 年前月 净增万 年前月 净增万 净增万 O∞ON Source: QuestMobile TRUTH中国移动互联网数据库2019年4月 流量争夺持续白热化,互联网玩家开启多种流量争夺方式,其中()
  3. 所属分类:机器学习

    • 发布日期:2019-07-04
    • 文件大小:1048576
    • 提供者:woodzhang2006
  1. 万物互联:学术数据的互联、挖掘与可视化

  2. 随着物联网的不断发展,“物”的概念已扩展至学术数据领域。由于物联网节点的海量性以及节点关系的复杂性,用户很难直接从互联的学术数据中获得对所需信息的进一步分析。AceMap 作为一个学术搜索系统,为了能够帮助用户获得全方位的学术信息,通过自主研发的 AceKG 学术知识图谱,为用户提供了个性化查询以及实时生成结果的服务;同时,以学术地图(如论文地图、学者地图等)的方式直观呈现学术数据之间的关系,帮助用户高效获取所需信息。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38632146
« 12 3 4 5 6 7 8 9 10 ... 17 »