您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. solr-7.0.0.tgz

  2. Cloudera Search 使用的solr包。 Cloudera Search作为Cloudera CDH(Cloudera's Distribution, including Apache Hadoop)产品的一个重要组成部分,基于Apache Solr开源项目进行构建,其使用了Lucene、SolrCloud、Apache Tika、Solr Cell等相关技术。Cloudera Search提供近实时(Near-Real-Time)数据访问服务,允许非技术人员通过简单的全文搜索接口,
  3. 所属分类:算法与数据结构

    • 发布日期:2019-02-25
    • 文件大小:148897792
    • 提供者:hero2018zz
  1. tika-core 元数据提取工具类

  2. Apache元数据提取工具类,可以提取图片,文本,视频等元数据
  3. 所属分类:Java

    • 发布日期:2019-04-29
    • 文件大小:647168
    • 提供者:qq_40971752
  1. Cloudera_Administrator_Training_cdh5.pdf

  2. Cloudera Administrator Training for Apache Hadoop 英文版Course Chapters Introduction The Case for Apache Hadoop Hadoop Cluster Installation The Hadoop Distributed File System(HDFS) Map Reduce and Spark on YARN Hadoop Configuration and Daemon Logs Gettin
  3. 所属分类:Hadoop

    • 发布日期:2019-07-16
    • 文件大小:51380224
    • 提供者:c275090933
  1. ipfs-search, 星际 文件系统 搜索引擎.zip

  2. ipfs-search, 星际 文件系统 搜索引擎 ipfs搜索工具 搜索引擎为星际 文件系统 服务。 嗅探DHT的gossip和索引文件和目录散列。元数据和内容使用 ipfs-tika 提取,搜索使用 ElasticSearch 5完成,队列使用RabbitMQ完成。
  3. 所属分类:其它

    • 发布日期:2019-09-17
    • 文件大小:109568
    • 提供者:weixin_38744435
  1. google-api-services-gmail-v1-rev6-1.19.0.zip

  2. elasticsearch-mapper-attachments.zip,mapper attachments插件使用apache tika将附件类型添加到elasticsearch。
  3. 所属分类:其它

    • 发布日期:2019-09-26
    • 文件大小:6291456
    • 提供者:weixin_38743481
  1. custom-detector-tika,.zip

  2. 建造和运行:
  3. 所属分类:其它

    • 发布日期:2019-10-11
    • 文件大小:100663296
    • 提供者:weixin_38744153
  1. 1-Elasticsearch开发技术详解及技术指导.rar

  2. 本人从事ES搜索开发多年,本资料亲测具有指导意义,对于刚刚从事es或elk开发实践的人员有很大帮助,对于本文检索结合tika工具包具有优秀的指导意义
  3. 所属分类:Java

    • 发布日期:2020-09-15
    • 文件大小:121634816
    • 提供者:wangshaohua10
  1. lenny:视频文件的自动检测和转换工具-源码

  2. 关于 Lenny是自动电影检测和转换工具。 它检测不支持的视频文件并将其转换为其他格式。 流动 通过使用Tika检测MIME类型来搜索下一个视频文件 使用ffprobe检测当前流 将流与支持的格式进行比较 如果不支持,请转换视频 去开始 为什么 因为我收集了一大堆不兼容ChromeCast格式的老电影,所以我很烦恼只能自己手工转换它们。 如何使用 帮助的样子 usage: lenny [-h] -s SOURCE -t TARGET -ffprobe FFPROBE -ffmpeg FFMPEG
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:21504
    • 提供者:weixin_42097557
  1. pizza-parlor-源码

  2. 比萨饼店 作者 版本 cuurent唯一可用的版本是 描述 这是比萨店的网络应用程序,该店出售比萨饼,它还显示有关他们所出售的不同比萨饼的详细信息,菜单,还允许客户根据所需的大小,结皮在线订购他们喜欢的比萨饼,还允许他们输入他们希望将比萨运送到的位置。 截屏 实时页面 安装/设置说明 打开终端{Ctrl + Alt + T} git clone https://github.com/anzalmohamed/pizza-parlor.git CD披萨店 代码 。 或原子。 取决于您选择的文本
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:4194304
    • 提供者:weixin_42165973
  1. base64:编码解码Base64。 Utiliza Apache Tika para obter o mimetype dos字节[] dos arquivos-源码

  2. 编码/解码Base64 RealBase o可以在base64上进行编码:在base64和Salqui上可以使用txt 实时解码txt(cujoconteúdoéum base64):salva em imagem(jpg ou png)ou pdf,符合mimetype 编码 内含物:dog.jpeg 赛达语:dog.txt(转换为base64) 解码 Entrada:dog.txt Saída:dog.jpeg,图像/ jpeg的SE模仿类型 推荐人
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:81920
    • 提供者:weixin_42168265
  1. 机器学习和自然语言处理

  2. 首先我们要意识到预处理的重要性。在大数据的背景下,越来越多的非结构化半结构化文本。如何从海量文本中抽取我们需要的有价值的知识显得尤为重要。另外文本格式常常不一,诸如:pdf,word,excl,xml,ppt,txt等常见文件类型你或许经过一番周折还是有办法处理的。倘若遇到database,html,邮件,RTF,图像,语音等文件,你是否素手无策了。基于此本文总结ApacheTika内容抽取工具,其强大之处在于可以处理各种文件,另外节约您更多的时间用来做重要的事情。Tika是一个内容分析工具,自
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:685056
    • 提供者:weixin_38663733
  1. jeito:联合国文件编制所涉及的空间-源码

  2. 耶托 联合国文件空间法 发展 安装 Sur发行版GNU / Linux Ubuntu,单机外壳,执行命令的命令: $ sudo apt-get install git docker.io python3 python-virtualenv python3-dev libpq-dev libxml2-dev libxslt1-dev $ docker run --name jeito-postgres -e POSTGRES_USER=jeito -p 5432:5432 -d postgres
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:567296
    • 提供者:weixin_42097450
  1. 自述文件-源码

  2. 项目名称:README.md -generator 徽章 项目描述:我使用node.js生成的第一个自述文件。 目录 安装 npm安装npm初始化 用法 自述文件是介绍和说明项目的文本文件。 它包含了解项目内容通常所需的信息。 贡献者 蒂卡·阿迪卡卡里(Tika Adhikari) 测试 回答所有问题并检查返回的输入 问题 如有任何疑问,请通过电子邮件联系。 执照 麻省理工学院执照 版权(c) 特此免费授予获得该软件和相关文档文件(“软件”)副本的任何人无限制使用软件的权利,包括但不限于使用,
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:29360128
    • 提供者:weixin_42148975
  1. 增强型搜索引擎-源码

  2. 增强型搜索引擎 将拼写检查和自动完成功能添加到搜索引擎 •使用Solr和Lucene索引《洛杉矶时报》的页面。 使用Java和Python进行边缘列表创建和页面排名计算。 •使用PHP和Apache开发了一个网站。 合并了自动完成和拼写更正等增强功能。 主要工具和技术:Solr,Lucene,Python,Java,Tika,Maven,Apache,Virtual Box,信息检索技术
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:235520
    • 提供者:weixin_42118770
  1. luceneserver:在Apache Lucene之上的高性能“瘦包装” HTTP REST服务器-源码

  2. Lucene服务器 该项目在 6.x版快照源之上提供了一个简单的示例HTTP服务器,通过简单的REST / JSON HTTP API有效地公开了Lucene的许多核心和模块功能。 请注意,这段代码都是非常新的,可能会有令人兴奋的错误! 但这也非常快! 该服务器在上“正在生产中”运行, 是开发人员用来查找Lucene,Solr和Tika jira的近乎实时更新的简单搜索实例。 设计 该设计与流行的基于Lucene的搜索服务器和不同之处在于,它更多地是围绕Lucene功能的最小且精简的包装。
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:712704
    • 提供者:weixin_42136365
  1. Hultz-Assorted:这是一个披萨递送应用程序,允许用户选择披萨类型,大小,结皮和浇头,然后由应用程序计算价格加上递送费用-源码

  2. 赫尔兹什锦 作者 版 07.2020 / 001 描述 这是Hultz-Assorted的网络应用程序,这是一家披萨销售公司,可显示有关他们出售的服务和不同披萨的详细信息,菜单以及允许客户根据其大小,所需的结皮以及在线订购他们喜欢的披萨的详细信息允许他们输入他们希望将piza传递到的位置。 实时页面 安装/设置说明 打开终端{Ctrl + Alt + T} git clone https://github.com/Washikokevv27/Hultz-Assorted.git cd Hul
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:7340032
    • 提供者:weixin_42097450
  1. miner:Miner是一个PHP库,用于从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用类似于Apache Tika中的简化HTML元数据解析器-源码

  2. 矿工 该库是一部分,有关更多信息,请参见 。 Miner是一个PHP库,可从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用就像的简化。 WTF是矿工吗? - 考虑下面来自LinkedIn的屏幕截图: 当您在LinkedIn上发布指向您的联系的链接时,它将自动为您提取标题,摘要,甚至封面图像。 矿工通常可以用来完成这样的任务。 安装 安装Golem软件包的最佳简便方法是使用 。 打开composer.json并将以下内容添加到require数组: "yoozi/
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:13312
    • 提供者:weixin_42116734
  1. 语言:for适用于Java和JVM的最准确的自然语言检测库,适用于长文本和短文本-源码

  2. 快速资讯 该库试图解决非常短的单词和短语甚至比tweet短的语言检测 利用统计和基于规则的方法 超过70种语言的性能优于Apache Tika , Apache OpenNLP和Optimaize Language Detector 可在每个Java 6+应用程序中以及在Android上使用 无需额外的语言模型培训 用于添加您自己的语言模型的api 离线使用而无需连接到外部服务或API 可以在REPL中使用,以快速试用 目录 7.1 7.2 9.19.2 1。 这个图书馆做什么?
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:147849216
    • 提供者:weixin_42165583
  1. 机器学习和自然语言处理

  2. 首先我们要意识到预处理的重要性。在大数据的背景下,越来越多的非结构化半结构化文本。如何从海量文本中抽取我们需要的有价值的知识显得尤为重要。另外文本格式常常不一,诸如:pdf,word,excl,xml,ppt,txt等常见文件类型你或许经过一番周折还是有办法处理的。倘若遇到database,html,邮件,RTF,图像,语音等文件,你是否素手无策了。基于此本文总结Apache Tika内容抽取工具,其强大之处在于可以处理各种文件,另外节约您更多的时间用来做重要的事情。Tika是一个内容分析工具,
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:685056
    • 提供者:weixin_38731553
« 1 2 3 4 5 6»