您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. forte:Forte是TExt的灵活而强大的NLP构建器。 这是CASL项目的一部分-源码

  2. Forte是用于构建自然语言处理管道的工具包,具有跨任务交互,适应性强的数据模型接口和可组合管道的功能。 Forte最初是在CMU中开发的,由与其他机构合作做出了积极贡献。~~~~该项目是家族的一部分。 Forte提供了一个以高度可组合的方式组装最新的NLP和ML技术的平台,包括从信息检索,自然语言理解到自然语言生成的广泛任务。 使用Forte,构建一个可以在一个地方搜索文档,分析,提取信息和生成语言的集成系统非常简单。 这使开发人员可以充分利用各个模块的优势,合并每个步骤的结果,并使系统能
  3. 所属分类:其它

  1. Turkish-Bert-NLP-Pipeline:基于Bert的NLP管道,用于土耳其语,Ner,情绪分析,问题回答等-源码

  2. 土耳其语-Bert-NLP-管道 简而言之,管道 在这个项目中,我们旨在为土耳其建立基于Bert的NLP管道;命名实体识别(Ner),情感分析,问题回答,摘要和文本分类。 简而言之,请检查文件“ 有关详细的应用程序,请检查 管道详情 情绪分析 预建模型 如何使用它 NER模型 预建模型 如何使用它 问题回答 预建模型 如何使用它 文字摘要即将推出 文字分类 预建模型 如何使用它 这些模型基于土耳其伯特模型微调 我的所有模特都在 请参阅Python笔记本文件“带有BERT.ipynb的土耳其语N
  3. 所属分类:其它

  1. Twitch-chat-NLP:数据管道,将Twitch聊天文本数据流式传输到数据库,并使用它来训练用于自然语言处理任务的机器学习模型-源码

  2. Twitch-chat-NLP 一种数据管道,可将Twitch聊天文本数据流式传输到数据库,并使用它来训练用于自然语言处理任务的机器学习模型。
  3. 所属分类:其它

  1. spacy-extreme:如何将spaCy用于超大文件而不遇到内存问题的示例-源码

  2. Spacy-极端 如何将spaCy用于超大文件而不遇到内存问题的示例 spaCy的内存问题 编辑: 中修复了运行spaCy管道的内存问题。 不过,我将使该存储库保持在线状态,作为有关如何有效地分块数据的教育性代码段。 本节的其余部分可以忽略。 SpaCy是一种流行的,功能强大的NLP工具,可以处理文本并从中获取您可能需要的几乎所有信息。 不幸的是,在对30GB以上的单个文件进行多处理时,我开始遇到问题:内存使用量一直在增长。 即使使用,问题仍然存在。 “错误修复”不可用,因为尚不清楚内存泄漏的
  3. 所属分类:其它

  1. Disaster-Response-Pipeline:创建了自然语言处理(NLP)机器学习管道,以根据发送者传达的需求对真实的用户紧急消息进行分类-源码

  2. 目录 项目动机 灾害响应管道项目 该项目的目标是对灾难事件期间从图八提供的数据集中发送的合法消息进行分类。 它要求我们建立机器学习管道,以根据发送方实时传达的需求对紧急消息进行分类。 特定的机器模型是自然语言处理(NLP)模型。 该项目分为三个主要部分: 构建ETL管道以提取数据,清理数据并将其存储到SQlite数据库中。 构建ML模型以训练分类器将消息置于最准确的类别中。 运行该应用程序以实时显示模型的准确性和结果。 结果汇总 该Web应用程序能够对发送的消息进行分类,并将其置于最合适
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:10mb
    • 提供者:weixin_42143806
  1. ClosedDomainQA:实验性封闭域质量检查管道,用于构建可查询联合国项目文档的电报聊天机器人-源码

  2. 神经问题解答: 问题回答(QA)是信息检索和自然语言处理(NLP)领域中的一门计算机科学学科,它与自动回答人类用自然语言提出的问题的建筑系统有关。 问题解答的实现通常是计算机程序,它可以通过查询通常是知识库的知识或信息的结构化数据库来构造其答案。 更常见的是,问答系统可以从自然语言文档的非结构化集合中获取答案。 。 尝试使用该应用程序,使用由句子转换器提供支持的神经质量保证管道来向开发计划署项目文档提出未解决的问题,以建立语料库嵌入和段落排名。 为了检索,采用了提取QA的预训练变压器模型。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:63mb
    • 提供者:weixin_42118056
  1. Medical-Sieve:风险投资公司端到端基于主题的情感分析项目-源码

  2. 医学筛:基于主题的情绪分析,用于患者的叙事 风险投资公司端到端基于主题的情感分析项目 医学筛:自上而下地破解患者情感并释放风险机会基于主题的情感分析使我们能够将计算语言学应用于庞大的非结构化数据集-并了解患者生活中的真实情况。 背景 利用AI和NLP激发患者的沉默之痛 在此持续的大流行时期中,您可能一直在经历抑郁,焦虑或任何精神问题,甚至被冠状病毒本身捕获。 尝试访问各种医疗资源后,您可能会遇到很多麻烦,并且在此过程中,问题已得到很好甚至正确的解决。 这促使我们开始思考检测各种主题患者的情绪,并
  3. 所属分类:其它

  1. Deloitte_INsight-Data_Driven_Industry_Analysis-源码

  2. Deloitte INsight:数据驱动的行业分析平台 你好呀! 我的名字叫杰斯·杨。 我是Deloitte INsight的核心贡献者之一,Deloitte INsight是即将推出的财务数据产品,旨在加速特定业务领域中数据驱动的分析。 我的主要工作 语言为中文,产品发布后将立即进行翻译。 NLP分类工具箱 数据仪表板 数据管道 [嵌入]
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:18mb
    • 提供者:weixin_42102272
  1. DaCy:用于培训Danish Spacy的Danish Processing管道的存储库-源码

  2. DaCy:适用于丹麦语的SpaCy NLP管道 DaCy是经过SpaCy培训的丹麦预处理流水线。 在撰写本文时,它在丹麦语的所有基准测试任务中均达到了最先进的性能。 该存储库包含用于复制DaCy的代码。 要下载模型,请使用DaNLP软件包(请求挂起),SpaCy()或直接下载项目。 再生产 DaCy文件夹包含一个SpaCy项目,该项目将允许复制结果。 此文件夹还包括DaNE上的评估指标。 用法 要使用直接下载简单方法加载项目,请将下载的“ packages”文件夹放在目录中,然后使用SpaCy加
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:214kb
    • 提供者:weixin_42133753
  1. NLP管道-源码

  2. NLP管道
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:114kb
    • 提供者:weixin_42102272
  1. NLP体系结构:Metis数据科学训练营,NLP项目4-源码

  2. 了解建筑语言 1.提示 这项工作的目的是双重的。 1.创建一个“基线”领域特定的word2vec模型,该模型可用于通过编写体系结构的方式在体系结构概念之间绘制潜在的关系,以及2.作为案例研究,尝试查找特定概念的含义和方式建筑概念随着时间的推移发生了变化 2.数据 该项目使用的数据是从1960年代中期开始的大约50年的161篇建筑历史/理论/批评论文。 我显示这些图像是出于一个重要目的。 每个文档的格式不一致。 因此,必须以这样的方式推广预处理技术,以最大程度地减少花在每个文档上的时间,同时最大化
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:10mb
    • 提供者:weixin_42117116
  1. Context_Based_QnA_Chatbot_PyQt5:问题解答聊天机器人,与特定上下文有关的问题-源码

  2. Context_Based_QnA_Chatbot_PyQt5 使用PyQt5工具回答的聊天机器人问题,针对与特定上下文有关的问题 终结了这个机器人的Transformaers架构 从Hugging Face激怒了NLP管道的使用 内容 视觉效果 [ ] 语境 这里以埃隆·马斯克(Elon Musk)的Wiki页面为背景,可将其提供给转化器 可以将其他上下文(例如Books或任何其他文学作品)作为上下文,以构建QnA机器人 [ ] 安装 -Install使用克隆后以下命令所有依赖关系库: p
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:11kb
    • 提供者:weixin_42150341
  1. NeuronBlocks:NLP DNN工具包-像玩乐高游戏一样建立NLP DNN模型-源码

  2. 像玩乐高游戏一样建立NLP DNN模型 目录 总览 NeuronBlocks是一个NLP深度学习建模工具包,可帮助工程师/研究人员构建用于NLP任务的神经网络模型训练的端到端管道。 该工具包的主要目标是最小化NLP深度神经网络模型构建的开发成本,包括训练和推理阶段。 NeuronBlocks由两个主要组件组成: Block Zoo和Model Zoo 。 在Block Zoo中,我们提供了常用的神经网络组件作为模型架构设计的构建块。 在Model Zoo中,我们以JSON配置文件的形式提供
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:12mb
    • 提供者:weixin_42181686
  1. J-JSON-NLP:Java JSON-NLP Maven模块和验证器-源码

  2. Java JSON-NLP模块 [C)2019 ,Umang Mehta,Aarushi Bisht,Jagpreet Chawla, ,... Java Maven模块和验证器。 由带给您。 介绍 越来越多的自然语言处理(NLP)工具,模块,管道。 似乎对于输出格式没有任何标准。 在这里,我们着重于输出格式语法的标准。 将来的版本可能也会解决输出语义。 是NLP管道和组件可以生成的最重要输出的标准。 相关文档可以在 GitHub存储库及其网站。 Java 模块是实现为JSON模式
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:52kb
    • 提供者:weixin_42126668
  1. onnx_transformers:加速的NLP管道,用于在CPU上进行快速推断。 使用Transformers和ONNX运行时构建-源码

  2. onnx_transformers 加速的NLP管道以进行快速推理 :rocket: 在CPU上内置 :hugging_face: 变压器和ONNX运行时。 安装: pip install git+https://github.com/patil-suraj/onnx_transformers 用法: 注意:这是一个实验项目,仅在PyTorch中进行了测试 流水线API与变压器相似,只是有一些区别,下面将进行说明。 只需提供模型的路径/ URL,如果需要,它将从下载模型并自动创建onnx
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:140kb
    • 提供者:weixin_42150341
  1. spacy-udpipe:spaCy + UDPipe-源码

  2. 空间+ UDPipe 该软件包包装了快速有效的语言不可知的NLP管道(通过其),因此您可以将用作50多种语言的管道。 受启发,此软件包提供的精度稍低的模型反过来又要快得多(请参阅和基准)。 安装 使用软件包管理器安装spacy-udpipe。 pip install spacy-udpipe 安装后,使用spacy_udpipe.download()下载所需语言的预训练模型。 可以在找到支持的语言的预训练UDPipe模型的完整列表。 用法 加载的UDPipeLanguage类返回一个sp
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:19kb
    • 提供者:weixin_42168341
  1. 项目:from从原型到生产的端到端NLP工作流程-源码

  2. :ringed_planet: 项目模板 使您可以管理和共享针对不同用例和域的端到端spaCy工作流,并协调培训,打包和服务自定义管道。 您可以从克隆预定义的项目模板开始,根据需要对其进行调整,加载数据,训练管道,将其导出为Python包,将输出上传到远程存储并与团队共享结果。 :warning_selector: spaCy项目模板需要新的 ,当前可作为每晚预发行版使用。 您可以从pip像spacy-nightly一样spacy-nightly安装它: pip install spacy-n
  3. 所属分类:其它

  1. 墨西哥政府报告:2019年墨西哥政府报告上的文本挖掘,涵盖从PDF文件中提取文本到绘制结果的过程-源码

  2. 墨西哥政府报告文本分析 该存储库记录了以下过程:从PDF中提取文本,进行清理,将其通过NLP管道传递,并用图形显示结果。 PDF是9月1日发布的2019年政府报告。 PDF位于数据文件夹中。 要求 该项目使用以下Python库 PyPDF2 :用于从PDF文件中提取文本。 spaCy :用于将提取的文本传递到NLP管道中。 NumPy :用于快速矩阵运算。 pandas :用于分析数据集并从中获取见解。 matplotlib :用于创建图形和绘图。 seaborn :用于增强matp
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:14mb
    • 提供者:weixin_42171132
  1. subreddit-analyzer:全面的数据和文本挖掘工作流程,可处理来自任何给定公共subreddit的提交和评论-源码

  2. Subreddit分析器 该项目记录了使用Pushshift API下载大量Reddit提交和评论的过程,以获取有趣的见解,例如按工作日,小时和最常用词的分发方式。 该项目分为三个主要部分,即ETL过程,NLP管道以及图表和见解的生成。 以下是所包含脚本的摘要: subreddit_comments.py-一个Python脚本,可从Pushshift API下载固定数量的注释。 subreddit_submissions.py-一个Python脚本,可从Pushshift API下载固定
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:18mb
    • 提供者:weixin_42169674
  1. Neurocoref:spa通过神经网络在空间中实现快速共指解析-源码

  2. :sparkles: NeuralCoref 4.0:与神经网络在空间中的共指解析。 NeuralCoref是spaCy 2.1+的管道扩展,它使用神经网络注释和解析共指群集。 NeuralCoref已投入生产,已集成到spaCy的NLP管道中,并可扩展到新的培训数据集。 有关共指解析和NeuralCoref的简要介绍,请参阅我们的。 NeuralCoref用Python / Cython编写,并且带有仅针对英语的经过预先训练的统计模型。 NeuralCoref随附有可视化客户端 ,它是由
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:66mb
    • 提供者:weixin_42161497
« 12 3 »