您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. PDF结构解析(c++源代码)

  2. 读取PDF文档的结构,包括源码,是C++的,通个这个小程序可以更加理解PDF的文件格式和结构。
  3. 所属分类:C++

    • 发布日期:2009-05-08
    • 文件大小:29696
    • 提供者:liujinze
  1. pdf转文本 linux源码

  2. pdf转文本, linux源码,包含在 xpdf 里。
  3. 所属分类:C

    • 发布日期:2013-09-12
    • 文件大小:795648
    • 提供者:kamo54
  1. Jacob处理Word文档搞定了

  2. 开发步骤: 首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大   1、将压缩包解压后,Jacob.jar添加到Libraries中;   2、将Jacob.dll放至“WINDOWSSYSTEM32”下面。 当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = "C:\AA";   只指定到了文件夹一级,正确写法是String htmlfile
  3. 所属分类:Web开发

    • 发布日期:2009-04-24
    • 文件大小:178176
    • 提供者:qumeihui
  1. C# 读取pdf 转换成txt(不需要任何配置直接用)

  2. 不需要安装pdftotext 不需要配置靠过去直接就能用,完美的转成txt 文本
  3. 所属分类:C#

    • 发布日期:2018-08-29
    • 文件大小:73400320
    • 提供者:u011943116
  1. pdf-extract:节点PDF提取-源码

  2. 节点PDF Node PDF是一组工具,可接收PDF文件并将其转换为可用格式以进行数据处理。 该库既支持从可搜索的pdf文件中提取文本,也支持对pdf进行OCR,而pdf只是文本的扫描图像 安装 要开始安装模块。 npm install pdf-extract 安装库后,您将需要在路径上访问以下二进制文件以处理pdf。 pdf文件pdftk将多页pdf拆分为单页。 PDF文本pdftotext用于从可搜索的pdf文档中提取文本 幽灵脚本ghostscr ipt是ocr预处理程序,可将p
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:2097152
    • 提供者:weixin_42162171
  1. UdacityMeme-源码

  2. 模因发生器 概述 这是模因生成器,它将文本和图像结合在一起以创建模因。 应用程序可以分为三个部分:应用程序引擎,控制台应用程序和Web应用程序-它既可以用作consol应用程序,也可以用作Web应用程序。 它包含自己的图像和报价基础,但也允许用户提供自己的图像和报价。 设置 需求保存在requirements.txt中,因此可以使用pip安装: pip install -r requirements.txt PDF解析器使用pdftotext命令应用程序,可以在Linux上安装 sudo a
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:2097152
    • 提供者:weixin_42144604
  1. Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容

  2. 前言 想要做全文搜索引擎,则需要将word/pdf等文档内容提取出来。对于pdf有xpdf等一些开源方案。 但Word文档的情况则会复杂一些。 提取PDF文本内容 XPDF是一个免费开源的软件,用于显示PDF文件,并可将pdf转换成文字图片等,同样支持Windows版。在Debian Linux上安装非常简单: apt-get install xpdf 我们这里只使用pdftotext这个功能,直接输入可查看帮助: rootraspberrypi:/var/www# pdftotext
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:50176
    • 提供者:weixin_38536397
  1. PDF文字提取工具 xpdf_pdftotext

  2. PDF文字提取工具 xpdf_pdftotext 已经配置好配置文件 pdftotext ? Portable Document Format (PDF) to text converter (version 4.03) http://www.xpdfreader.com/pdftotext-man.html 通过XPDF读取PDF内容并转化为txt格式的过程中,可能会出现如下提示: Syntax Error: Unknown character collection 'Adobe-GB1
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:12582912
    • 提供者:xcntime
  1. PA193_TeamProject:PA193中团队项目的存储库(安全证书解析器)-源码

  2. PA193_TeamProject PA193中团队项目的存储库(安全证书解析器) 任务 输入:TXT文件(PDF通过pdf转换为TXT文件) Use –layout option with pdftotext 输出:带有提取信息的结构化JSON 附加功能: 支持命令行参数,用于漂亮地打印文档的子部分 标题 目录 使用的库的版本•修订 参考书目 同时支持多个输入文件–专注于正确的错误处理 项目阶段 第一阶段–第三周截止检查分配的证书并注释数据(每个人的独奏工作)–由3人组成的团队(用于下一
  3. 所属分类:其它

    • 发布日期:2021-03-28
    • 文件大小:1048576
    • 提供者:weixin_42117224