您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 领域相关的 Web网站抓取方法

  2.   本文提出了一种抓取领域相关的 Web站点的方法 ,可以在较小的代价下准确地收集用户所关心领域内的网站。这种方法主要改进了传统的聚焦爬虫( Focused Crawler)技术 ,首先利用 Meta2Search技术来改进传统 Crawler 的通过链接分析来抓取网页的方法 ,而后利用启发式搜索大大降低了搜索代价 ,通过引入一种评价领域相关性的打分方法 ,达到了较好的准确率。本文详细地描述了上述算法并通过详细的实验验证了算法的效率和效果。
  3. 所属分类:Web开发

    • 发布日期:2010-09-16
    • 文件大小:471kb
    • 提供者:yerida