您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. N-Gram+编辑距离+单词距离

  2. 单词纠错技术,计算单词距离方法,基于多重索引模型的词典 近似匹配算法
  3. 所属分类:其它

    • 发布日期:2009-12-02
    • 文件大小:201kb
    • 提供者:AndyNJUX
  1. 一种基于N-gram模型和机器学习的汉语分词算法

  2. 一种基于N-gram模型和机器学习的汉语分词算法,不错的分词算法。
  3. 所属分类:其它

    • 发布日期:2009-12-26
    • 文件大小:1mb
    • 提供者:sutine
  1. 基于n-gram的文本分类

  2. 基础文档,曾被国际上多次引用。通过多反面对比了n-gram技术在文字引索中的应用。
  3. 所属分类:网络基础

    • 发布日期:2012-05-06
    • 文件大小:73kb
    • 提供者:pokemones3
  1. 基于n-gram中英文字符串分割算法实现

  2. 基于n-gram中英文字符串分割算法实现
  3. 所属分类:Perl

  1. 基于N-Gram的语言识别技术

  2. 基于N-Gram的语言识别技术,非常有启发性,网上还有很多open-source的代码可以学习。
  3. 所属分类:其它

    • 发布日期:2008-09-04
    • 文件大小:42kb
    • 提供者:the3gwireless
  1. 基于词表和N-gram算法的新词识别实验

  2. 基于词表和N-gram算法的新词识别实验
  3. 所属分类:Web开发

    • 发布日期:2013-12-29
    • 文件大小:412kb
    • 提供者:linseng129
  1. 一种基于N-Gram改进的文本特征提取算法

  2. 一种基于N-Gram改进的文本特征提取算法
  3. 所属分类:Java

    • 发布日期:2014-04-08
    • 文件大小:371kb
    • 提供者:u014598501
  1. 一种基于n-gram短语的文本聚类方法研究

  2. 一种基于n-gram短语的文本聚类方法研究
  3. 所属分类:机器学习

    • 发布日期:2017-07-24
    • 文件大小:494kb
    • 提供者:yuxu9710108
  1. 毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究

  2. 毕业论文范文基于N-Gram的G蛋白偶联序列分类方法的研究
  3. 所属分类:其它

    • 发布日期:2018-06-05
    • 文件大小:119kb
    • 提供者:ai763978985
  1. 基于ngram多特征的流量载荷类型分类方法(论文)

  2. 丁杰u 黄亮3庹宇鹏〃 桑亚飞u 张永铮1 1(中国科学院信息工程研究所北京100093) 2(中国科学院大学北京100049) 3 (国家计算机网络应急技术处理协调中心北京100029) VoL34 No.2 Feb. 2017 摘 要 相关研究具有重要意义。 目前,网络流量分类技术主要按照应用类型或者协议类型对网络流量分类,不能够对未 知流量和加密流量进行分析和识别。因此提出一种基于n-gram多特征的流量载荷类型分类方法来实现对网络 数据包中传输内容的类型的识别,即将流量按照其载荷类型分
  3. 所属分类:网络安全

    • 发布日期:2019-07-18
    • 文件大小:1mb
    • 提供者:qq_37717661
  1. N-Gram-Based Text Categorization.pdf

  2. 基于n-gram的文本识别论文。William B. Cavnar and John M. Trenkle Environmental Research Institute of Michigan
  3. 所属分类:互联网

    • 发布日期:2020-08-30
    • 文件大小:142kb
    • 提供者:weixin_50005008
  1. 基于N-Gram的计算机病毒特征码自动提取的改进方法.7z

  2. 【转发】【引用】【论文】随着计算机技术的发展和普及,计算机病毒带来的危害日趋严重。传统 N-Gram 算法难以提取不同长度的特征,导致有效特征缺失,并产生庞大的特征集合,造成空间的浪费。针对这些问题,提出一种改进的基于 N-Gram 的特征码自动提取方法。该方法在原有 N-Gram 特征才是取算法的基础上引入变长 N-Gram 特征,才是取不同长度的有效特征,生成不定长病毒特征码。综合考虑特征频率的相关性,利用特征浓度对 N-Gram 特征进行有向筛选,生成数据字典,节省存储空间。实验结果表明,
  3. 所属分类:网络安全

    • 发布日期:2021-03-24
    • 文件大小:692kb
    • 提供者:wonderdaydream
  1. 基于互信息和邻接熵的新词发现算法

  2. 如何快速高效地识别新词是自然语言处理中一项非常重要的任务,针对当前新词发现存在的 问题,提出了一种从左至右逐字在未切词的微博语料中发现新词的算法。通过计算候选词语 与其右邻接字的互信息来逐字扩展,得到候选新词;并通过计算邻接熵、删除候选新词的首 尾停用词和过滤旧词语等方法来过滤候选新词,最终得到新词集。解决了因切词错误导致部 分新词无法识别以及通过 n-gram 方法导致大量重复词串和垃圾词串识别为新词的问题,最 后通过实验验证了该算法的有效性。
  3. 所属分类:其它

  1. 使用N-Gram模型基于特征扩展的短文本分类

  2. 使用N-Gram模型基于特征扩展的短文本分类
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:505kb
    • 提供者:weixin_38522106
  1. mongoid_fulltext:Mongoid ODM的基于n-gram的全文本搜索实现-源码

  2. 蒙古文全文搜索 使用针对Mongoid ODM的n元语法匹配进行全文搜索。 MongoDB在v2.4中引入了全文本搜索功能,因此,该gem非常适合于您想要的东西少于成熟的索引服务的情况。 mongoid_fulltext gem可让您在相对较短的字符串中进行模糊字符串搜索,这非常适合根据Rails模型的显示名称填充自动完成框,但不适用于为成千上万HTML文档建立索引。 安装 此gem的0.6.1或更高版本需要Ruby 1.9.3或更高版本,并且可以与Mongoid 3、4、5和6一起使用。对
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:36kb
    • 提供者:weixin_42097819
  1. 基于n-gram卷积神经网络的MoRF预测

  2. 基于n-gram卷积神经网络的MoRF预测
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:331kb
    • 提供者:weixin_38590790
  1. textcat:Go包,用于基于n-gram的文本分类,并支持utf-8和原始文本-源码

  2. 一个Go包,用于基于n-gram的文本分类,并支持utf-8和原始文本。 去做: 写文件 使它更快 关键字:文本分类,语言检测器 安装 go get github.com/pebbe/textcat go get github.com/pebbe/textcat/textcat go get github.com/pebbe/textcat/textpat 文件
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:524kb
    • 提供者:weixin_42146086
  1. 基于N-gram语言模型的哈萨克文机构名识别

  2. 针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:337kb
    • 提供者:weixin_38506852
  1. 基于N-GRAM的朝鲜文索引方法与性能评价

  2. 进行朝鲜文索引时,需要通过分析音节和词素而把名词提取成索引词,但词典中未登录词将造成分析工作的模糊性,从而导致不能进行正确索引。本文基于N-gram有利于分析词典中未登录词的特性,提出一种新的朝鲜文索引方法。通过对比分析和性能评价表明,所提出的方法是有效的。
  3. 所属分类:其它

  1. pygrams:从大量文档(> 1000)中提取关键术语(n-gram)并预测出现-源码

  2. 工具说明 这个基于python的应用程序( pygrams.py )旨在从大量(> 1,000)文档pygrams.py自由文本中提取流行或紧急出现的n-gram /术语(单词或短短语)。 出于测试目的,包括了已授予专利文件摘要的示例语料库。 应用程序管道(用户选项部分中的更多详细信息): 数据可以通过几种文本文档类型(例如,csv,xls,腌制的python数据框等)。 这是整个语料库中经过处理的术语(ngram)列表。 这些术语是稀疏矩阵的列。 用户可以控制以下参数:最小文档频率
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:338mb
    • 提供者:weixin_42169971
« 12 3 »