您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 小偷程序(模拟请求,抓取网页内容)

  2. 很多朋友多问过我如何抓取网页的内容,其实并不难,但是对于网页的分析却不是很简单,以前我接触正则表达式比较少,就自己去分析页面,结果是要么抓到的数据不准,要么就根本抓不到。 现在写了两个类给朋友们用,使用正则表达式分析网页的,效率还算可以吧,暂时我就用到这几个功能,如果朋友们有什么好的想法可以联系我,共同把这个API强大起来。 例子就不写了,里面有帮助文档和正则表达式测试工具,自己看看吧。 提供三个下载地址: http://www.xiaojingdou.com/Thief.rar http:/
  3. 所属分类:Java

    • 发布日期:2009-06-28
    • 文件大小:44kb
    • 提供者:suolong123
  1. 静态网页内容抓取深度搜索

  2. 通过对静态网页的分析,将里面的链接全部挑选出来,然后按照深度搜索一一分析页面文件,若查找到搜索的内容则导入生成的文本,很简短的小程序。有兴趣的用户可以继续修改完善其功能。
  3. 所属分类:其它

    • 发布日期:2009-07-14
    • 文件大小:7kb
    • 提供者:hbb21st
  1. 睿思页面分析专家2.0

  2. 睿思页面分析专家是一款功能强大、方便好用并且完全免费的网页性能分析及评测工具,不仅可以为网站的开发以及运维人员排忧解难,也是所有网络从业者的得力助手。 通过本产品,您可以对页面用户体验和页面结构直接进行评测打分,用户可了解到页面打开过程的各项统计数据,包括:页面整体耗时、页面首屏耗时、页面整体速度、页面总体大小、完成元素个数等等。用户还可根据自己的需要修改各评分项的权重值。详细瀑布图则展示了页面中每一个元素所在主机的IP地址和所属地区,元素下载过程中每个阶段详细用时,元素的Header头信息,
  3. 所属分类:网络基础

    • 发布日期:2010-11-30
    • 文件大小:9mb
    • 提供者:sialie
  1. c#多线程抓取网页内容

  2. 在《爬虫/蜘蛛程序的制作(C#语言)》一文中,已经介绍了爬虫程序实现的基本方法,可以说,已经实现了爬虫的功能。只是它存在一个效率问题,下载速度可能很慢。这是两方面的原因造成的: 1. 分析和下载不能同步进行。在《爬虫/蜘蛛程序的制作(C#语言)》中已经介绍了爬虫程序的两个步骤:分析和下载。在单线程的程序中,两者是无法同时进行的。也就是说,分析时会造成网络空闲,分析的时间越长,下载的效率越低。反之也是一样,下载时无法同时进行分析,只有停下下载后才能进行下一步的分析。问题浮出水面,我想大家都会想到
  3. 所属分类:C#

    • 发布日期:2010-12-18
    • 文件大小:6kb
    • 提供者:mfr625
  1. jsoup网页内容分析

  2. 可以用与html页面内容分析,提取所需内容,由于htmlParser好久没更新,可以考虑用这个试试
  3. 所属分类:Java

    • 发布日期:2012-03-22
    • 文件大小:249kb
    • 提供者:sqlife_cn
  1. C#写的网页抓取软件源码

  2. 很好用的,用C#写的网页内容抓取工具,很完整的vs2008项目
  3. 所属分类:C#

    • 发布日期:2013-06-02
    • 文件大小:173kb
    • 提供者:u010928159
  1. VB源码:通过XML读取网页内容并分析取得需要的数据

  2. 本程序演示了在VB种用XML对象读取远程网页的代码。 并通过HTMLDocument分析出网页的文本内容。 再通过分行识别处理的方法提取出所需要的网页数据。 源贴由CSDN的mylajilaji提出 主题是:如何提取网页的数据 http://topic.csdn.net/u/20080919/17/5c6d551f-91c3-4d44-9bc8-0c30c87afbd5.html 本程序为解决办法。
  3. 所属分类:VB

    • 发布日期:2008-09-20
    • 文件大小:2kb
    • 提供者:SupermanKing
  1. 内容分析工具rost cm

  2. ROST cm是一款免费的大型内容分析研究性工具平台,主要功能包括:辅助各学科进行研究,协助完成文本分析和内容分析方面的研究,凡是需要分析论文、微博、博客、论坛、网页、书籍、聊天记录、电子邮件、本地文本类格式文件、数据库中各类文本字段的学科,都可以使用本软件,分析方法目前支持:分词、字频统计、词频统计、聚类、分类、情感分析(含简单和复杂)、共现分析、同被引分析,依存分析、语义网络、社会网络、共现矩阵等分析方法。
  3. 所属分类:其它

    • 发布日期:2013-10-16
    • 文件大小:8mb
    • 提供者:u012460048
  1. JAVA使用爬虫抓取网站网页内容的方法

  2. 主要介绍了JAVA使用爬虫抓取网站网页内容的方法,实例分析了java爬虫的两种实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-03
    • 文件大小:42kb
    • 提供者:weixin_38509656
  1. python使用htmllib分析网页内容的方法

  2. 主要介绍了python使用htmllib分析网页内容的方法,涉及Python使用htmllib模块的相关技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-22
    • 文件大小:22kb
    • 提供者:weixin_38629206
  1. Python读取网页内容的方法

  2. 主要介绍了Python读取网页内容的方法,实例分析了Python基于URL读取网页内容的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:25kb
    • 提供者:weixin_38727087
  1. Python3访问并下载网页内容的方法

  2. 主要介绍了Python3访问并下载网页内容的方法,实例分析了Python页面抓取及写入文件的实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:23kb
    • 提供者:weixin_38620314
  1. Python简单实现网页内容抓取功能示例

  2. 主要介绍了Python简单实现网页内容抓取功能,结合实例形式分析了Python基于urllib模块的网页请求、内容读取等相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:37kb
    • 提供者:weixin_38624556
  1. Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例

  2. 主要介绍了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作,结合实例形式分析了Python基于urllib包的网页内容获取,以及使用BeautifulSoup分析html相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-19
    • 文件大小:38kb
    • 提供者:weixin_38612648
  1. node.js抓取并分析网页内容有无特殊内容的js文件

  2. nodejs获取网页内容绑定data事件,获取到的数据会分几次相应,如果想全局内容匹配,需要等待请求结束,在end结束事件里把累积起来的全局数据进行操作,本文给大家介绍node.js抓取并分析网页内容有无特殊内容的js文件,需要的朋友参考下
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:63kb
    • 提供者:weixin_38570296
  1. PHP实现网页内容html标签补全和过滤的方法小结【2种方法】

  2. 主要介绍了PHP实现网页内容html标签补全和过滤的方法,结合实例形式分析了php常见的标签检查、补全、闭合、过滤等相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-10-19
    • 文件大小:53kb
    • 提供者:weixin_38632825
  1. Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例

  2. 本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下: 利用 urllib包 获取网页内容 #引入包 from urllib.request import urlopen response = urlopen("http://fund.eastmoney.com/fund.html") html = response.read(); #这个网页编码是gb2312 #print(html.decode("gb2312")
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:41kb
    • 提供者:weixin_38675506
  1. python使用htmllib分析网页内容的方法

  2. 本文实例讲述了python使用htmllib分析网页内容的方法。分享给大家供大家参考。具体实现方法如下: import htmllib, urllib, formatter, sys website = urllib.urlopen("http://yourweb.com") data = website.read() website.close() format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout)) p
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:28kb
    • 提供者:weixin_38611388
  1. node.js抓取并分析网页内容有无特殊内容的js文件

  2. nodejs获取网页内容绑定data事件,获取到的数据会分几次相应,如果想全局内容匹配,需要等待请求结束,在end结束事件里把累积起来的全局数据进行操作! 举个例子,比如要在页面中找有没有www.baidu.com,不多说了,直接放代码: //引入模块 var http = require("http"), fs = require('fs'), url = require('url'); //写入文件,把结果写入不同的文件 var writeRes = function(p, r) {
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:63kb
    • 提供者:weixin_38629449
  1. 网络大数据的文本内容分析

  2. 文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »