您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. vb 词组分类源码纯文本超强分析

  2. 对文本内容根据设定的关键字来提取 hankerdream@126.com
  3. 所属分类:VB

    • 发布日期:2009-07-03
    • 文件大小:13kb
    • 提供者:hankerdream
  1. 风越批量提取文本工具

  2. 批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取的文本内容生成TXT文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数)
  3. 所属分类:Web开发

    • 发布日期:2009-12-18
    • 文件大小:9mb
    • 提供者:liunu
  1. 将网页中的文本信息进行提取

  2. 可以提取网页中文本内容到文本文件中,过滤功能未做,如有需求请发QQ邮箱,售价:100RMB
  3. 所属分类:其它

    • 发布日期:2010-02-21
    • 文件大小:8kb
    • 提供者:zhumeicjw
  1. PDF文件文本内容提取的设计和实现

  2. PDF文件文本内容提取的设计和实现.pdf
  3. 所属分类:专业指导

    • 发布日期:2010-04-20
    • 文件大小:414kb
    • 提供者:w6682106
  1. CopyWebs 提取防复制网页内容小工具

  2. 看到有些网站内容不允许大家复制,也不允许点右键,看到精彩的东东容您错过?不急,这个小工具能满足您的需要。当然只能提取纯文本内容。想要那些自己可以直接复制了。 程式没做什么美工,不要介意。实用就好。用了个RichTextBox,如果没有的朋友可以一起下载,经过实践用自带的TextBox控件内能提取到65535字节的数据。这个不用说大家也知道。
  3. 所属分类:Web开发

    • 发布日期:2010-08-31
    • 文件大小:24kb
    • 提供者:wlnetwork
  1. PDF 文件文本内容提取的设计与实现

  2. PDF 文件格式是面向显示的,本身缺乏语义信息,如果不将其内容提取出来,就不能实现基于语义的查询。本文设计并实现了一款PDF 内容提取的工具,首先对PDF 文件进行了文本解析,将正文内容字符串流从源码中提取出,并对提取后的字符串流利用解密算法进行解密,然后利用Filter 解码算法进行解码,最后将PDF 的文本内容从解码后的字符串流中提取出。结果表明本文提出的方法不但能够非常准确的实现PDF 文件格式的转换,而且可以非常方便的嵌入到搜索引擎中。
  3. 所属分类:其它

    • 发布日期:2010-10-27
    • 文件大小:414kb
    • 提供者:weitongqi
  1. 风越批量文本提取、网页采集器

  2. 批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 可设置提取文件的间隔,避免下载网页过快,服务器不响应 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容 提取HT
  3. 所属分类:Web开发

    • 发布日期:2010-11-08
    • 文件大小:10mb
    • 提供者:liunu
  1. c#多线程抓取网页内容

  2. 在《爬虫/蜘蛛程序的制作(C#语言)》一文中,已经介绍了爬虫程序实现的基本方法,可以说,已经实现了爬虫的功能。只是它存在一个效率问题,下载速度可能很慢。这是两方面的原因造成的: 1. 分析和下载不能同步进行。在《爬虫/蜘蛛程序的制作(C#语言)》中已经介绍了爬虫程序的两个步骤:分析和下载。在单线程的程序中,两者是无法同时进行的。也就是说,分析时会造成网络空闲,分析的时间越长,下载的效率越低。反之也是一样,下载时无法同时进行分析,只有停下下载后才能进行下一步的分析。问题浮出水面,我想大家都会想到
  3. 所属分类:C#

    • 发布日期:2010-12-18
    • 文件大小:6kb
    • 提供者:mfr625
  1. c#开发的客户端文本编辑器控件

  2. 用C#开发的类似word的富文本编辑器控件,支持字体、排版、插入图片、网页内容提取、颜色拾取等,功能超强,并可以扩展。完全开源的。并成功运用于校园网邮件*系统。基于C# .NET2.0开发的。
  3. 所属分类:C#

    • 发布日期:2010-12-19
    • 文件大小:43kb
    • 提供者:kk8cn
  1. PDF文件文本内容提取研究

  2. PDF文件文本内容提取研究............
  3. 所属分类:其它

    • 发布日期:2011-09-14
    • 文件大小:527kb
    • 提供者:fengyunjack
  1. 基于提取网站层次结构的网页分类方法

  2. 网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容 的分类和基于网页间超链接结构的分类。但是这些分类都只利用了网页的信息,没有考虑到网页所 在网站提供的信息。文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的 层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到 电子商务智能搜索和挖掘系统中
  3. 所属分类:网页制作

    • 发布日期:2011-10-28
    • 文件大小:360kb
    • 提供者:duan_123456
  1. 呼日太蒙古文WPS Office 2002文件内容提取工具

  2. 本工具适用于蒙古文WPS Office2002格式已损文件的内容提取。 1、按照蒙古文WPS Office2002格式提取文本内容; 2、字符集编码范围提取、不管它的格式如何,直接由蒙科立编码范围和ASCII码范围来提取文本内容。
  3. 所属分类:其它

    • 发布日期:2012-01-06
    • 文件大小:140kb
    • 提供者:buren
  1. SliDoc - PowerPoint文件(PPTX)文本内容萃取器(C#编写)

  2. 用于提取微软Office 2010 PowerPoint的PPTX文件的文本内容的小工具。 基于OpenXML的API。 只能用于最新的基于XML的PPTX文件,对老版本的PPT文件不适用。 供需要的用户使用以及需要学习OpenXML相关技术的同学学习。 在目录下已经附有一个可执行文件SliDoc.exe;如不能运行则需要用用Visual Studio 2010编译
  3. 所属分类:C#

    • 发布日期:2012-08-07
    • 文件大小:95kb
    • 提供者:quanben
  1. 网页文本提取器

  2. 批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容
  3. 所属分类:其它

    • 发布日期:2012-11-12
    • 文件大小:12mb
    • 提供者:chuck3561
  1. PDF文件文本内容提取的设计与实现

  2. PDF 文件文本内容提取的设计与实现论文
  3. 所属分类:其它

    • 发布日期:2013-04-16
    • 文件大小:414kb
    • 提供者:lwl0606
  1. 开源网页内容提取

  2. C#开源网页内容提取,可以网页提取或者纯文本提示
  3. 所属分类:C#

    • 发布日期:2013-07-30
    • 文件大小:35kb
    • 提供者:cyb331
  1. 网页内容提取v2.0

  2. 开发工具:vc6.0 从htm/html格式的网页文件中提取内容。将要提取内容的网页文件用鼠标拖入窗口,按回车即可完成转换。转换后的文件是与原文件同名的文本文件。支持文件夹批量转换!
  3. 所属分类:C++

    • 发布日期:2007-04-20
    • 文件大小:122kb
    • 提供者:ablenavy
  1. 文件内容提取器2.0(中文版)

  2. 自己写的一款小型的文件内容提取(查找)工具,支持对整个文件夹进行搜索提取。 工具支持多种过滤方式和其他一些选项。有不足的地方欢迎私我...
  3. 所属分类:C++

    • 发布日期:2014-09-13
    • 文件大小:44kb
    • 提供者:c913421043
  1. viky-ai:自然语言处理平台。 允许从非结构化文本中提取信息-源码

  2. 欢迎来到viky.ai 什么是viky.ai viky.ai是自然语言处理平台。 它允许您从非结构化文本内容中提取信息。 技术组件nlp允许提取结构化信息,此提取在代理中定义。 代理商是会说多种语言的助手,以查找相关数据。 nlp组件将一组JSON格式的代理和非结构化文本内容作为输入,以提供结构化数据的JSON流作为输出。 第二个技术组件是一个Web应用程序,允许您通过提供专用界面来协同工作以设置代理。 它还提供了解释API,以允许集成到第三方系统中。 入门 您可以在Linux和macOS
  3. 所属分类:其它

  1. miner:Miner是一个PHP库,用于从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用类似于Apache Tika中的简化HTML元数据解析器-源码

  2. 矿工 该库是一部分,有关更多信息,请参见 。 Miner是一个PHP库,可从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用就像的简化。 WTF是矿工吗? - 考虑下面来自LinkedIn的屏幕截图: 当您在LinkedIn上发布指向您的联系的链接时,它将自动为您提取标题,摘要,甚至封面图像。 矿工通常可以用来完成这样的任务。 安装 安装Golem软件包的最佳简便方法是使用 。 打开composer.json并将以下内容添加到require数组: "yoozi/
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:13kb
    • 提供者:weixin_42116734
« 12 3 4 5 6 7 8 9 10 ... 36 »