说明: 信息检索与算法研究 NekoHTML学习笔记 NekoHTML学习笔记 J. Andrew Clark用Java写了一系列的工具(Java APIs),NekoHTML是其中之一。 NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。这个解析器能投扫描HTML文件并“修正”许多作者(人或机器)在编写HTML文档过程中常犯的错误。NekoHTML能增补缺失的父元素、自动 用结束标签关闭相应的
<dolphin_maple> 上传 | 大小:5kb