您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. sql2005全文检索.doc

  2. SQL Server 2005全文检索技术在网站上的应用实录 http://tech.ddvip.com 2008年01月21日 社区交流 Excel服务器-用Excel做管理系统 关键字: DataGuard checkpoint 动态查询 synonyms 卸载SQL 2005 SQL Server群集 内容摘要:本文提供了网站如何设计和实现基于SQL Server 2005的全文检索实例,希望能对正在使用SQL Server 2005构建网站搜索的同仁有所裨益。 一、前言 “人类失去搜索
  3. 所属分类:其它

    • 发布日期:2009-09-09
    • 文件大小:506kb
    • 提供者:a522920779a
  1. lingpipe文本挖掘工具包

  2. lingpipe 是alias公司开发的一款自然语言处理软件包,包括的模块:   主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Characte
  3. 所属分类:其它

    • 发布日期:2010-01-26
    • 文件大小:951kb
    • 提供者:moryan
  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17mb
    • 提供者:lingjoin
  1. 灵柩软件 可用于汉语分词处理

  2. LJParser文本搜索与挖掘开发平台的十大功能: 1. 全文精准检索 支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索,支持AND/OR/NOT以及NEAR邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。 3. 分词标注: 对原始语料进行分词
  3. 所属分类:Web开发

    • 发布日期:2010-11-05
    • 文件大小:672kb
    • 提供者:zhangguoqiang52
  1. LJFeatureDet_SDK新词/特征词发现基础件(共享版)

  2. 从给定的大规模文本文件集合中,挖掘出内涵的新词语列表,可以用于用户专业词典的编撰。识别出的新词结果还可以进一步编辑标注,编辑好的新词词典,可以作为专业知识库导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化情况。文本特征词发现系统LJFeatureDet,此系统能够识别出文本集合中的关键特征词汇以及词典中没有出现过的词汇、短语、命名实体、流行用语,是专业语言文献分析方面的一把利器。特征词发现脱胎于语言自动分词技术,又是对分词技术的有效提升和补充。
  3. 所属分类:其它

  1. Web Data Mining (英文)

  2. 目录回到顶部↑ 第一部分 数据挖掘基础. 第1章 概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章 关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
  3. 所属分类:专业指导

    • 发布日期:2012-05-02
    • 文件大小:8mb
    • 提供者:chen_767
  1. lingpipe4.1源码

  2. 包括的模块:   主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character Language Modeling)、医学文献下载/解析/索
  3. 所属分类:Java

    • 发布日期:2014-08-22
    • 文件大小:65mb
    • 提供者:lishiyin
  1. NLPIR大数据搜索与挖掘共享开发平台

  2. 一、简介 NLPIR文本搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。 NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处
  3. 所属分类:C/C++

    • 发布日期:2014-10-24
    • 文件大小:40mb
    • 提供者:u012548562
  1. 短语挖掘

  2. 伊利诺伊大学厄本那香槟分校(University of Illinois at Urbana-Champaign),韩家炜数据挖掘课讲义,本篇主要讲述各种短语挖掘算法
  3. 所属分类:讲义

    • 发布日期:2015-09-22
    • 文件大小:2mb
    • 提供者:Quantum_bit
  1. Python-基于PySpark的大规模短语挖掘

  2. 使用数据驱动方法检测大量文本中的常用短语。 发现的短语的大小可以是任意的。 可以用于英语以外的语言
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:82mb
    • 提供者:weixin_39840387
  1. 大型公文的词汇短语

  2. 大型公文的词汇短语以挖掘自身潜藏的能力为核心,致力于为你提供最实用的大型公文的词汇短语,赶快来下载...该文档为大型公文的词汇短语,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  3. 所属分类:其它

  1. CITPM:基于集群的迭代主题短语挖掘框架

  2. CITPM:基于集群的迭代主题短语挖掘框架
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:925kb
    • 提供者:weixin_38752907
  1. DSC180-Capstone-Web-源码

  2. DSC180-Capstone-Web 背景 短语挖掘的目的是从大量文本语料库中提取高质量的短语。 它标识短语而不是一个字母组合词,从而提供了对文本的更多理解。 在这项研究中,我们将AutoPhrase方法应用于两个不同的数据集,并比较了多词和单词短语排名列表的降级质量排名列表。 我们的数据集来自英文版的《科学》论文摘要,以及来自维基百科的英语知识库。 在前端Web开发中,我们构建了前端Web。 我们利用超文本标记语言(HTML)在Web浏览器中进行结构化和设计,并借助级联样式表(CSS)-样
  3. 所属分类:其它

  1. 顺序连续模式挖掘-源码

  2. 顺序连续模式挖掘 这个问题的目的是让您更好地了解根据您在课堂上学到的知识,将模式挖掘算法应用于实际应用程序。 了解一个新问题并设计一种算法来解决。 实现频繁的连续顺序模式挖掘算法,以从文本语料库中挖掘频繁的短语。 问题定义 连续的顺序模式是一个项目序列,经常在许多序列的数据库中显示为连续的子序列。 例如,如果语料库是 good fish sandwich and french fries disgusting fish sandwich but good french fries thei
  3. 所属分类:其它

  1. DSC180-Capstone-Web-源码

  2. DSC180-Capstone-Web 背景 短语挖掘的目的是从大量文本语料库中提取高质量的短语。 它标识短语而不是一个字母组合词,从而提供了对文本的更多理解。 在这项研究中,我们将自动短语法应用到两个不同的数据集中,并比较了多词和单词短语排名列表的降级质量排名列表。 我们的数据集来自英文的《科学》论文摘要,以及来自维基百科的英语知识库。 在前端Web开发中,我们构建了前端Web。 我们利用超文本标记语言(HTML)在网络浏览器中进行结构化和设计,并借助级联样式表(CSS)-样式演示和支持交互
  3. 所属分类:其它

  1. AutoPhrase:AutoPhrase:Massive Text Corpora中的自动短语挖掘-源码

  2. 自动短语:从大量文本语料库中自动进行短语挖掘 刊物 如果您使用的是我们的工具,请引用以下两篇论文。 谢谢! 尚静波,刘加禄,姜萌,任翔,Clare R Voss,韩佳玮,“”,被IEEE Transactions on Knowledge and Data Engineering,2018年2月接受。 刘加鲁*,尚静波*,王驰,任翔和韩佳伟,“”,2015年ACM SIGMOD国际数据管理大会(SIGMOD'15),澳大利亚墨尔本,2015年5月。(*同样贡献, ) 近期变动 2020.06
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:61mb
    • 提供者:weixin_42131633
  1. DSC180B-顶盖-源码

  2. 背景 短语挖掘的目的是从大量文本语料库中提取高质量的短语。 它标识短语而不是一个字母组合词,从而提供了对文本的更多理解。 在这项研究中,我们将自动短语法应用到两个不同的数据集中,并比较了多词和单词短语排名列表的降级质量排名列表。 我们的数据集来自英文的《科学》论文摘要,以及来自维基百科的英语知识库。 通过这个项目,我们将能够通过识别AutoPhrase方法产生的不同结果来了解AutoPhrase方法的优势以及如何在两个数据集中实施Autophrase。 要求 如果您在本地运行: 安装了g ++
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:90kb
    • 提供者:weixin_42118160
  1. nlp-in-practice:用于解决实际文本数据问题的入门代码。 包括:Gensim Word2Vec,短语嵌入,具有逻辑回归的文本分类,具有pyspark的单词计数,简单的文本预处理,预训练的嵌入等等-源码

  2. NLP实践 使用这些NLP,文本挖掘和机器学习代码示例和工具来解决现实世界中的文本数据问题。 笔记本/来源 第一列中的链接将您带到带有源代码的子文件夹/存储库。 任务 相关文章 来源类型 描述 python脚本 使用PySpark提取大量数据的短语。 使用这些短语注释文本或将这些短语用于其他下游任务。 python脚本+笔记本 使用字数统计或tfidf可视化热门关键字 笔记本 如何正确使用Word2Vec以获得所需的结果 python脚本 如何使用PySpark读取带有字数示例的不同格式的文件
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:93mb
    • 提供者:weixin_42172204
  1. 基于子主题选择与三级分层结构的Web文本挖掘方法

  2. 针对用户和查询之间的意图差距导致的查询模糊宽泛和数据稀疏问题,根据流行性和多样性返回可能子主题的排名列表,利用子主题选择与排序的分层结构进行Web 文本挖掘。首先,在名词性短语和可替代部分查询的基础上,使用简单模式提取各种相关的短语作为候选子主题;然后,使用网页文档集合中的相关文档构建候选子主题的三级层次结构;最后,综合考虑流行性和多样性,利用该结构和估计的流行度进行排序。实验使用了NTCIR-9库的100个日文查询和来自TREC 2009库的100个英文查询以及网络跟踪多样性任务,实验结果验证
  3. 所属分类:其它

  1. 评价主题挖掘及其倾向性识别

  2. 主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语,再运用LDA模型挖掘潜在的评价主题。然后利用多特征融合的方法计算句子的倾向性,进而根据特征词群统计出各主题的倾向性结果。最后通过对网络汽车评论文本语料的实验证实了该方法的有效性。
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:289kb
    • 提供者:weixin_38538585
« 12 »