您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. N-Gram+编辑距离+单词距离

  2. 单词纠错技术,计算单词距离方法,基于多重索引模型的词典 近似匹配算法
  3. 所属分类:其它

    • 发布日期:2009-12-02
    • 文件大小:205824
    • 提供者:AndyNJUX
  1. 生物算法_编辑距离_Fasta_滑动窗口_smith

  2. 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith 生物算法_编辑距离_Fasta_滑动窗口_smith
  3. 所属分类:其它

    • 发布日期:2010-12-27
    • 文件大小:11534336
    • 提供者:ksp_liusa
  1. 结合改进编辑距离与SVM的图像分类方法

  2. 提出了一种图像分类方法,结合图像的多尺度字符串表示以及改进的编辑距离和SVM分类器进行图像分类。首先,对图像进行多尺度分块,提取各个归一化图像子块上的方向梯度直方图特征,并将生成的多尺度特征向量用多个字符串进行表示;然后,提出融合编辑操作,改进字符串的编辑距离,通过计算两幅图像对应的两组字符串之间的改进编辑距离来测量两幅图像的相似度;最后,采用改进的编辑距离计算径向基函数,进行改进的SVM分类。实验结果表明,该方法的分类正确率高,且平均分类耗时少。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:454656
    • 提供者:weixin_38592455
  1. NLP 最小编辑距离计算器

  2. 计算最小编辑距离,显示最小距离的计算搜索方式。
  3. 所属分类:互联网

    • 发布日期:2020-10-29
    • 文件大小:30408704
    • 提供者:weixin_44128857
  1. Python实现计算最小编辑距离

  2. 最小编辑距离或莱文斯坦距离(Levenshtein),指由字符串A转化为字符串B的最小编辑次数。允许的编辑操作有:删除,插入,替换。具体内容可参见:维基百科—莱文斯坦距离。一般代码实现的方式都是通过动态规划算法,找出从A转化为B的每一步的最小步骤。从Google图片借来的图, Python代码实现, (其中要注意矩阵的下标从1开始,而字符串的下标从0开始): def normal_leven(str1, str2): len_str1 = len(str1) + 1 len_
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:50176
    • 提供者:weixin_38613330
  1. 基于动态规划思想的编辑距离计算

  2. 编辑距离: 给定两文本或句子,计算需要多少步操作能够从一个句子转换为另外一个句子,允许操作有增加、删除和替换。距离越小,说明二者越相似,距离与大,说明二者差距越大。 利用动态规划计算编辑距离,其模型如下: 对于两个字符串a和b,计算两个字符串的相似度,即计算两个字符串的编辑距离,相当于计算它们字串的编辑距离,再加上从子串到全串所需的最少编辑次数即可,不断地进行递推。 递推公式如下: hp[i][j]指的是a的前i个字符和b中前j个字符之间的距离,字符串计算从index = 1开始(实际预算需要
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:56320
    • 提供者:weixin_38502510
  1. 面试必考字符串相关的动态规划——最大公共子序列、最大公共子串、编辑距离

  2. 字符串相关的动态规划最大公共子序列最大公共子串编辑距离 简述这三个算法解决的问题和展示状态转移方程并且给出可通过执行的Python代码。 最大公共子序列 子序列是,一个字符串中的任意字符组成的序列,重点在于,不要求子序列是原字符串的连续序列。 如下例子所示,acg是abcdefg的子序列,但不是连续子序列。 abcdefg ==> acg 两个字符串的最大公共子序列的状态转移方程式如下: dp[i][j]={max{dp[i−1][j],dp[i][j−1]}if s1[i]!=s2
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:40960
    • 提供者:weixin_38685831
  1. 编辑距离(Levenshtein Distance)

  2. 是用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词w1,w2之间,由其中一个单词w1变为w2所需要的最少单字符编辑操作次数。 当两个字符串都为空串,那么编辑距离为0; 当其中一个字符串为空串时,那么编辑距离为另一个非空字符串的长度; 当两个字符串均为非空时(长度分别为 i 和 j ),取以下三种情况最小值即可: 1、长度分别为 i-1 和 j 的字符串的编辑距离已知,那么加1即可; 2、长度分别为 i 和 j-1 的字符串的编辑距离已知,那么加1即可; 3、长度分别为 i-1
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:120832
    • 提供者:weixin_38605144
  1. Ruby实现的最短编辑距离计算方法

  2. 利用动态规划算法,实现最短编辑距离的计算。 代码如下: #encoding: utf-8 #author: xu jin #date: Nov 12, 2012 #EditDistance #to find the minimum cost by using EditDistance algorithm #example output: #  “Please input a string: “ #  exponential #  “Please input the other string:
  3. 所属分类:其它

    • 发布日期:2021-01-02
    • 文件大小:31744
    • 提供者:weixin_38642369
  1. edit-distance-word-suggestion:使用编辑距离(Levenshtein距离)的单词建议,以查找词汇表中的下一个相似单词-源码

  2. 字词建议 建议使用编辑距离(Levenshtein距离)来查找词汇表中的下一个相似单词。 动机 付诸实践并比较一些编辑距离算法。
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:11264
    • 提供者:weixin_42173205
  1. go-edlib:Golang字符串比较和编辑距离算法库,具有-源码

  2. Go-edlib:编辑距离和字符串比较库 Golang字符串比较和编辑距离算法库,具有:Levenshtein,LCS,Hamming,Damerau levenshtein(OSA和相邻换位算法),Jaro-Winkler,Cosine等。 目录 要求 (v1.13 +) 介绍 Golang开源库,其中包括大多数(以及不久以后)的编辑距离和字符串比较算法,还有一些额外的功能! 设计为与Unicode字符完全兼容! 该库已100%测试覆盖 :beaming_face_with_smiling_
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:32768
    • 提供者:weixin_42130862
  1. 有效支持使用B +-树的基于编辑距离的字符串相似度搜索

  2. 编辑距离被广泛用于测量两个字符串之间的相似度。 作为基本操作,基于编辑距离的字符串相似度搜索是使用编辑距离在集合中查找与给定查询字符串相似的字符串。 回答此类字符串相似性查询的现有方法通过使用各种索引来遵循过滤验证框架。 通常,大多数方法都假定索引和数据集保存在主存储器中。 为了克服这个限制,在本文中,我们提出了一种基于B +树的方法来回答基于编辑距离的字符串相似性查询,因此,我们的方法可以轻松地集成到现有的RDBMS中。 通常,我们使用度量空间中采用的修剪技术来回答字符串相似性搜索,因为编辑距
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:2097152
    • 提供者:weixin_38677046
  1. 自动更正:这是具有编辑距离的自动更正问题-源码

  2. 自动更正 这是编辑距离自动修正的问题 如何运行此代码。 编译: mvn clean install 跑: java -cp target/auto-correct-1.0-SNAPSHOT.jar com.oracle.main.AutoCorrect src/main/resources/words.txt 参考: 编辑距离。 词典中的单词列表: : 编辑距离Geek for Geeks:DP问题
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:1048576
    • 提供者:weixin_42127754
  1. 基于图编辑距离的恶意代码检测

  2. 传统的恶意代码检测方法漏报率高且运行效率低,很大程度的依赖于人工检测.为解决该问题,基于恶意代码自身的函数调用顺序及程序结构特征,通过静态分析技术将恶意代码抽象为函数调用图,采用图的编辑距离作为恶意代码间相似度的评估标准,将恶意代码的分类识别转化为在已建立的恶意代码图数据库中搜索最小编辑距离邻居图的问题,在此基础上实现了用户检测未知文件恶意性的系统.为了提高检测速度,引入了函数对应的汇编指令集和多路优势点树的高维索引算法.实验证明,该方案兼顾了恶意代码检测的准确性和运行效率.
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:284672
    • 提供者:weixin_38629206
  1. Music_Plagiarsim_Detection:我们设计了一种基于编辑距离和最大匹配的新算法,根据音乐得分来检测音乐music窃-源码

  2. 音乐窃检测算法 在此项目中,我们开发了一种基于最大流和编辑距离的新颖音乐窃检测算法,并且还考虑了音乐理论来检测音乐相似的序列。 我们还针对依法判断的音乐窃的几种情况提出了新的实验,与其他算法相比,我们的算法显示出较高的准确性。 环境 pretty_midi == 0.2 . 9 numpy == 1.19 . 4 您可以通过以下命令设置环境: pip install -r requirements.txt 模型结构 我们的模型的结构如下所示。 在此模型中,音乐由音符序列表示。 音符序列被切
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:216064
    • 提供者:weixin_42150745
  1. 基于自适应编辑距离的颜料光谱匹配识别方法

  2. 为解决传统光谱匹配算法对同色系不同颜料物质光谱数据匹配识别精度不高的问题,提出了一种自适应阈值的编辑距离光谱匹配算法;研究了如何利用编辑距离对光谱反射率曲线差别敏感的特性来提高匹配精度的方法,同时通过自适应设定编辑距离的判定条件来减小算法匹配同种物质时在不同条件下光谱数据的误差。结果表明:与传统光谱匹配算法相比,自适应编辑距离算法的匹配精度更高,对颜料的识别结果更好。
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:3145728
    • 提供者:weixin_38536716
  1. 一种基于编辑距离的汉代画像石裂缝的检测算法

  2. 为了得到更好的画像石裂缝区域的检测结果, 提出了一种基于编辑距离的画像石裂缝的检测算法。将图像分为若干个大小相等的区域;为了将裂缝区域与背景区域区分开, 计算各个区域之间的编辑距离, 生成裂缝掩模图像;利用形态学中的膨胀运算进行掩模图中的空白区域填充;通过为掩模图像设定阈值完成对裂缝区域的标定。实验结果表明, 该算法可以对汉代画像石的裂缝区域进行精确检测。
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:17825792
    • 提供者:weixin_38569109
  1. edits.cr:编辑距离算法公司。 Jaro,Damerau-Levenshtein和最佳对准-源码

  2. edits.cr:编辑距离算法公司。 Jaro,Damerau-Levenshtein和最佳对准
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:16384
    • 提供者:weixin_42116734
  1. Java字符串相似度:各种字符串相似度和距离算法的实现:Levenshtein,Jaro-winkler,n-Gram,Q-Gram,Jaccard索引,最长公共子序列编辑距离,余弦相似度..-源码

  2. Java字符串相似度 一个实现不同字符串相似度和距离度量的库。 当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表... 下载 使用Maven: info.debatty java-string-similarity RELEASE 或检查。 该库需要Java 8或更高版本。 总览 下面介绍了每种已实现算法的主要特征。 “成本”列给出了计算成本的估算值,以分别
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:473088
    • 提供者:weixin_42126668
  1. Python文本相似性计算之编辑距离详解

  2. 编辑距离 编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。 例如将kitten一字转成sitting:(’kitten’ 和 ‘sitting’ 的编辑距离为3)      sitten (k→s)      sittin (e→i)      sitting (→g) Python中的Leve
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:75776
    • 提供者:weixin_38652270
« 1 2 3 45 6 7 8 9 10 ... 28 »