您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MySimHash.java

  2. java实现的SimHash算法,用于海量的网页去重和打拼量的文本相似度检测
  3. 所属分类:Java

    • 发布日期:2019-06-20
    • 文件大小:7kb
    • 提供者:wanglianrui123
  1. MySimHash.java

  2. 使用simhash进行文本查重,计算海明距离,海明距离越小说明越相似,例子: 文本一:使用simhash进行文本查重,计算海明距离,海明距离越小说明越相似 文本二:一个查重算法,计算海明距离,海明距离越小说明越相似 海明距离:14 文本相似度:78.125%
  3. 所属分类:Java

    • 发布日期:2020-08-05
    • 文件大小:6kb
    • 提供者:qq_42534961