© 1999-2048 dssz.net 粤ICP备11031372号
[Web开发] 开源WebHarvest抓取实例
说明: 1. template目录下的三个模板分别是 sina_1. 抓取全网财经要闻-新浪(一条新闻) sina_2. 抓取主流财经网站要闻区-新浪(列表新闻) sina_3. 抓取最新访谈-新浪(图文混合) sina_3_img 保存了图文混合的图片 2. 实例采用了XQuery表达式[loop、concat()、substring-after()、indexOf()等],XPath表达式[、、、等]<learnworm> 上传 | 大小:5kb