您好,欢迎光临本网站![请登录][注册会员]  
文件名称: 搜索引擎中网络爬虫的研究
  所属分类: 网管软件
  开发工具:
  文件大小: 3mb
  下载次数: 0
  上传时间: 2012-05-18
  提 供 者: dang****
 详细说明: 搜索引擎中网络爬虫的研究 论文 武汉理工大学硕士学位论文 第1章引言 1.1选题背景 人类社会的发展离不开知识的获取与发现,进入互联网时代以后,信息出现 了飞速地增长,对于网络上不断涌现的各种信息,人们的接受能力却是十分有 限的,这时人们就急切的需要一种技术手段,能够使信息的获取更加方便、准 确川。在这种需求的带动下,搜索引擎出现了,经过了几十年的发展,搜索引擎 现在己经成为了我们日常上网必备的工具之一,使用搜索引擎我们可以比较方 便地查找到所需要的信息,搜索也渐渐成为了人们开启互联网世界大门的一把 钥匙。 从技术的本质来讲,搜索引擎其实是信息检索技术在互联网时代的一种应用 表现形式。信息检索技术起源于对文献的参考查询和摘录索引工作,早在十九 世纪下半叶就已经开始对其进行相关的研究。信息检索包括对信息的存储、组 织、表现、查询、存取等几个方面[2]。其中对信息的索引和检索是关键,通过对 信息合理的组织可以使用户能够更加方便的对其进行访问;如何将用户的要求 准确合理的表达出来也是一个问题,往往需要使用系统规定的查询语言将用户 的要求通过规范化的形式表达出来;根据用户提出的查找要求,系统接下来所 做的工作就是准确、快速的返回符合要求的内容。 信息检索技术发展到今天已 经积累了许多成熟的理论,这些理论为搜索引擎的发展提供了强大的理论支撑。 1.2关于搜索引擎与爬虫 搜索引擎的工作过程,主要包括三个步骤[3]:从网上获取页面、建立索引、 从索引中查找结果并排序。 (1)从网上获取页面:搜索引擎的网络爬虫程序每隔一段时间就会对网上的页 面进行遍历,从一些页面开始,通过页面上的链接爬行到其它的页面,反复地 进行这个过程,在爬行的过程中会对相应的页面进行存储,为下一步的工作提 供原始的页面数据[410 <2)建立索引:搜索引擎的索引模块会对爬虫获取的页面进行分析,根据页面 ...展开收缩
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 相关搜索: 搜索引擎 网络爬虫 论文
 输入关键字,在本站1000多万海量源码库中尽情搜索: