您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Feature-Engineering-NLP:借助HuggingFace变压器,Tensorflow,Keras,TextBlob,NLTK,Sci-kit学习等进行功能工程-源码

  2. 功能工程-NLP 请在这里找到我的项目,以观察性能分析报告和交互式可视化效果: : 文本数据种类繁多,但原始形式却杂乱无章。 因此,特征工程是训练机器根据给定数据进行预测之前的重要步骤。 在我的笔记本中,我探索了许多预处理和功能工程技术,以从一系列虚假和真实的新闻数据中获取见解。 数据集: 使用的库: NLTK TextBlob 凯拉斯 张量流 HuggingFace变形金刚 正则表达式 大熊猫 科学工具学习 探索的功能: 情感主观性与极性 删除停用词,标点符号和降低的大小写:
  3. 所属分类:其它

  1. 词干形式-源码

  2. 词干形式
  3. 所属分类:其它

  1. Qutuf:Qutuf(قُطُوْف):阿拉伯语形态分析仪和词性标注器作为专家系统-源码

  2. 阿拉伯语形态分析仪(带词干分析器)和词性标注器 Qutuf(Quetuf):阿拉伯语形态分析仪(包括词根提取和根提取),以及作为专家系统的词性标注器。 现在可通过作为实验性Web服务使用。 Qutuf旨在成为阿拉伯语NLP(自然语言处理)框架的核心 在Qutuf,已经确定并实施了一些新概念。 类似于在预处理阶段的“第一规范化”和“第二规范化”文本形式,以及在词性标记任务中的“过早标记”和“过期标记”。 此外,POS标记被设计和实现为基于规则的专家系统。 基于形态特征标签集构建的POS标签集已
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:10mb
    • 提供者:weixin_42153615
  1. 土耳其形态:土耳其语的两级形态分析仪-源码

  2. 土耳其形态 土耳其语的两级形态分析仪。 这不是Google的官方产品。 组件 此实现由三层组成: 词汇表: 该层包括覆盖面很广的,可对其进行手动注释并针对词性和音素异常进行验证。 它们旨在用于构建土耳其语自然语言处理工具,例如形态分析仪。 我们提供的基本词典集包括用于注释的202,202个单词的词汇项目。 标签集和注释方案在进行了描述。 形态策略: 该层包括,这些定义以类似于AT&T FSM格式的自定义格式实现(唯一的不同是,我们可以将字符串用作状态名称和每个过渡的输入/输出标签,而
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:474kb
    • 提供者:weixin_42116705