点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 网页取文
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
小偷程序(模拟请求,抓取网页内容)
很多朋友多问过我如何抓取网页的内容,其实并不难,但是对于网页的分析却不是很简单,以前我接触正则表达式比较少,就自己去分析页面,结果是要么抓到的数据不准,要么就根本抓不到。 现在写了两个类给朋友们用,使用正则表达式分析网页的,效率还算可以吧,暂时我就用到这几个功能,如果朋友们有什么好的想法可以联系我,共同把这个API强大起来。 例子就不写了,里面有帮助文档和正则表达式测试工具,自己看看吧。 提供三个下载地址: http://www.xiaojingdou.com/Thief.rar http:/
所属分类:
Java
发布日期:2009-06-28
文件大小:44kb
提供者:
suolong123
htmlparser学习文档.rar
htmlparser,知道干什么的吗,可以用来抓取任何网页吗,给站长是在何时不过的了,这样能在短时间里抓取你要的任何东西
所属分类:
Web开发
发布日期:2009-12-05
文件大小:1mb
提供者:
yuyuer13
网页抓取脚本(by ruby)
用ruby写的网页抓取脚本,可用于在线文档下载以及整站下载。
所属分类:
Java
发布日期:2010-03-06
文件大小:10kb
提供者:
iillydan
htmlparser学习文档.rar
htmlparser学习文档 htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或 提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。 毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。 无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
所属分类:
Web开发
发布日期:2010-03-23
文件大小:1mb
提供者:
xxkkqq
VC++抓取远程文件(URL网页的源代码)
VC++抓取远程文件(URL网页的源代码) 这是一个通过inet来获取网页内容的程序,远程获取文件内容,实际上是通过URL地址来得到指定地址下某文档的源代码,如截图示,一看便知,不过如果是一些文本类型的文件,也是能获取到的,只不过你需要输入的地址完全正确。
所属分类:
C++
发布日期:2010-09-04
文件大小:19kb
提供者:
mirage1982
JRex 爬虫ajax网页 API文档
一般在浏览器中查看页面代码 是浏览器直接下载到的页面代码 在未经渲染前 对于JS AJAX输出的内容是无法得到的 这样我们得到的页面内容和直接走socket抓取回来无任何区别 还是无法得到需要的页面内容。 JS函数及页面元素事件的调用 这些很简单都是依靠用户的EVENT去驱动的,而我们通过SOCKET抓取页面对我们只是流而已无法去模拟用户的EVENT 没有这些EVENT 页面上需要EVENT驱动而展现的内容连显示都不可能 更无从抓取了。 JRex为我们解决了这个问题,试验证明JRex 比cob
所属分类:
Web开发
发布日期:2010-09-19
文件大小:1mb
提供者:
eagleking012
oracle知识库CHM文档
ORACLE 2000年问题白皮书 1. 导言 解决2000年兼容性问题,需要在日期的数据类型处理方面满足下列五个主要因素: 1. 正确处理2000年1月1日以前、当天及之后的日期信息、接收日期输入、提供日期输出、进行日期或日期子项的计算。 2. 随着新世纪的到来,采用正确的配置,以保证正常执行2000年1月1日以前、当天及之后的文件。 3. 在适当之处,以公开确定的方式解决世纪取值的含糊问题,以作为对两位数字日期输入的响应。 4. 以明确指出世纪的方式进行日期信息的存储和输出。 5. 根据q
所属分类:
Oracle
发布日期:2010-10-13
文件大小:1mb
提供者:
lovesmileman
ASP.NET网页抓取功能
项目结构说明: \ ……\App_Data 项目数据库文件 (ACCESS2003) ……\bin\ …………\AjaxPro.2.dll .NET调用AJAX类库 …………\App_Code.dll 功能类文件 …………\App_Web_ka4newz2.dll *.aspx.cs文件打包 ……\JS\ …………\jquery-1.4.4.min.js JQuery库 …………\scr ipt 系统自定义JS文件 ……\Default.aspx 系统功能页面 ……\Help.txt 帮助文档
所属分类:
Web开发
发布日期:2010-12-24
文件大小:165kb
提供者:
yashiralovesandy
ASP.NET 网页抓取WEB版
2010/12/30 v1.2版 改掉程序中所有的select标签 项目结构说明: \ ……\App_Data 项目数据库文件 (ACCESS2003) ……\bin\ …………\AjaxPro.2.dll .NET调用AJAX类库 …………\App_Code.dll 功能类文件 …………\App_Web_ka4newz2.dll *.aspx.cs文件打包 ……\JS\ …………\jquery-1.4.4.min.js JQuery库 …………\scr ipt 系统自定义JS文件 ……\De
所属分类:
Web开发
发布日期:2010-12-30
文件大小:167kb
提供者:
yashiralovesandy
Fiddler2中文帮助文档.chm
一款免费且功能强大的数据包抓取软件。它通过代理的方式获取程序http通讯的数据,可以用其检测网页和服务器的交互情况,能够记录所有客户端和服务器间的http请求,支持监视、设置断点、甚至修改输入输出数据等功能。fiddler包含了一个强大的基于事件脚本的子系统,并且能够使用.net框架语言扩展。
所属分类:
网络监控
发布日期:2012-03-23
文件大小:482kb
提供者:
miaochuanwei
htmlparser中文文档实例
htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或 提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。 毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。 无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
所属分类:
Java
发布日期:2012-06-27
文件大小:221kb
提供者:
xgskj
文档管理助手
电脑用多了,上网多了,您的电脑中是不是有很多有价值的文档?但是当您发现有一天需要这些文档时,它们却不知道跑到哪里去了,您是不是有这种痛苦的经历? 文档管理助手可以帮助您管理所有的文档。它支持Word、Html、Rtf、Txt、Wps、Mht等格式文档,界面直观,极易上手。主要特点: 单机版特点: 1、支持图文并茂的排版功能,所有文档均可直接编辑; 2、内置浏览器,并直接嵌入浏览器,轻松浏览、快速保存网页。可以保存网页中的图片、文本,甚至Flash文件;; 3、文档管理操作方式与资源管理器相
所属分类:
Web开发
发布日期:2006-03-16
文件大小:4mb
提供者:
wulianmin
文档管理助手
电脑用多了,上网多了,您的电脑中是不是有很多有价值的文档?但是当您发现有一天需要这些文档时,它们却不知道跑到哪里去了,您是不是有这种痛苦的经历? 文档管理助手可以帮助您管理所有的文档。它支持Word、Html、Rtf、Txt、Wps等格式文档,界面直观,极易上手。主要特点: 1、支持图文并茂的排版功能,所有文档均可直接在其中编辑; 2、内置强大的搜索功能,支持在所有文档中搜索特定文本功能; 3、内置简繁体转换;屏幕捕捉功能,轻松抓取屏幕图片; 4、支持拖放功能,文档管理非常方便; 5、内置
所属分类:
Web开发
发布日期:2006-03-16
文件大小:3mb
提供者:
wulianmin
网页取文模块
还在纠结网页山东各文字不可以复制么?这个模块编写的易语言小工具可以解决这个问题。
所属分类:
Web开发
发布日期:2012-11-28
文件大小:7kb
提供者:
xdwss
java 抓取网站数据源代码.doc
通过解析网页的源代码,我们发现了以下一些信息: 1. 搜索时页面请求的URL 是 http://search.51job.com/jobsearch/search_result.php 2. 请求所用的方法为:POST 3. 返回的页面的编码格式为:GBK 4. 假设我们想获取搜索java 人才时结果页面中显示的需求数量,我们发现数量位于返回的 HTML 数据中这样的一段代码之中:1-30 / 14794,于是我们可以得到这样的一个 模式:".+1-\d+ / (\d+).+",第一个分组的内
所属分类:
Web开发
发布日期:2013-04-11
文件大小:101kb
提供者:
baidwjpwwk
WHC.OrderWater.Commons公共类源码_文档[最新整理]
----------Database-------------- 1.DataTable帮助类(DataTableHelper.cs) 2.Access数据库文件操作辅助类(JetAccessUtil.cs) 5.查询条件组合辅助类(SearchCondition.cs) 6.查询信息实体类(SearchInfo.cs) 8.Sql命令操作函数(可用于安装程序的时候数据库脚本执行)(Sqlscr iptHelper.cs) ----------Device-------------- 声音播放
所属分类:
C#
发布日期:2013-09-27
文件大小:1mb
提供者:
yimjune
java网页抓取demo
包含jar包commons-logging,httpclient-4.1.2.jar,httpcore-4.2.1.jar main类文件,文档,源码
所属分类:
Java
发布日期:2013-10-23
文件大小:1mb
提供者:
wenjie4892543
HtmlParser2.0 帮助文档
htmlparser[1]是一个纯的java写的html(标准通用标记语言下的一个应用)解析的库,它不依赖于其它的java库文件,主要用于改造或 提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。 毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。 无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
所属分类:
其它
发布日期:2013-12-17
文件大小:1mb
提供者:
hanliang142857
VB6学习文档管理系统源码
VB6写的一款笔记软件的源码,里面包含有很多窗体控件的使用技巧,比如MSHFlexgrid表格、TreeView的动态加载、Ado的增删改查等。 本软件提供对日常生活、工作中的学习笔记、图文并茂存储以及自由抓取网页中好的文章进行管理存储。知识点: 1、MSHFlexgrid 表格的灵活运用,其中的表格列项显示、隐藏功能很有参考意义,另外还有列项位置的动态加载。 2、异性窗体,圆形窗体使用。 3、自制专业界面,虽然只有一个雏形,不过已经提供了一个简单的思路,菜单、选项卡、Treevi
所属分类:
VB
发布日期:2014-05-19
文件大小:642kb
提供者:
mbccie5
python实现从web抓取文档的方法
本文实例讲述了Python实现从Web的一个URL中抓取文档的方法,分享给大家供大家参考。具体方法分析如下: 实例代码如下: import urllib doc = urllib.urlopen(http://www.python.org).read() print doc#直接打印出网页 def reporthook(*a): print a #将http://www.renren.com网页保存到renre.html中, #每读取一个块调用一字reporthook函数 urllib.u
所属分类:
其它
发布日期:2021-01-20
文件大小:37kb
提供者:
weixin_38696590
«
1
2
3
4
5
6
7
8
9
10
...
19
»