您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 统计自然语言处理基础

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:专业指导

    • 发布日期:2012-07-26
    • 文件大小:26214400
    • 提供者:a06062125
  1. flash文件批量上传

  2. java struts2 flash 插件 批量文件上传 java 英文分词,统计词频,向量空间模型
  3. 所属分类:Java

    • 发布日期:2012-09-06
    • 文件大小:10485760
    • 提供者:yangguiyun123
  1. 原理与代码分析完整版.pdf

  2. 部分目录如下: 目录 第一篇:原理篇 第一章:全文检索的基本原理 一、总论 二、索引里面究竟存些什么 三、如何创建索引 第一步:一些要索引的原文档(Document)。 第二步:将原文档传给分次组件(Tokenizer)。 第三步:将得到的词元(Token)传给语言处理组件(Linguistic Processor)。 第四步:将得到的词(Term)传给索引组件(Indexer)。 1. 利用得到的词(Term)创建一个字典。 2. 对字典按字母顺序进行排序。 3. 合并相同的词(Term)成
  3. 所属分类:Web开发

    • 发布日期:2012-09-06
    • 文件大小:4194304
    • 提供者:h825503721
  1. indri-5.3-install

  2. 使用indri构建检索系统,在这个系统上可以实现基于自然语言模型和传统的向量空间模型以及Okapi的ad hoc或者分布式检索,可以使用结构化查询、跨语言检索、过滤、聚类等。
  3. 所属分类:C++

    • 发布日期:2012-11-28
    • 文件大小:26214400
    • 提供者:jiang_yuele
  1. 基于话题要素相似度计算的报道关系识别方法

  2. 本文针对现有的向量空间模型在表示同主题话题报道的不足,提出了一种基于话题要素的报道表示模型和相似 度计算方法。对于每一类话题要素,分别提出相应的相似度计 算方法,进而得到报道相似度计算方法。最后通过话题跟踪的 实验对基于话题要素的报道关系识别模型进行检验。实验表 明,基于话题要素的报道表示模型在处理同主题的报道关系识 别上是有效的。由于报道中可能涉及与核心事件不相关的信 息,如英国伦敦爆炸案中出现“美国总统布什”、“早在1982年” 等信息,这样在抽取时间、地点、人物等特征时会引入噪声,从而
  3. 所属分类:其它

    • 发布日期:2013-03-13
    • 文件大小:351232
    • 提供者:qqhyml
  1. Deep Web数据源分类模型研究

  2. Deep Web 数据源分类模型研究。分析了其研究的内容和面临的问题,提出了Deep Web 数据源分类模型,描述了表单特征的提取、预处理和基于向量空间的相似度计算.
  3. 所属分类:互联网

    • 发布日期:2013-03-23
    • 文件大小:1048576
    • 提供者:u010006791
  1. 自动文摘系统中的主题划分问题研究

  2. 随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优 势,使得其实用价值得到充分体现。而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问 题。本文提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文 章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明,该算法对多 主题文章的主题划分准确率为9212 % ,对单主题文章的主题划分准确率为9911 %。
  3. 所属分类:其它

    • 发布日期:2008-09-05
    • 文件大小:697344
    • 提供者:lansejingling
  1. 基于向量空间模型的中文文本分类技术研究

  2. 0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展.文本分词技术为大多数文本挖掘技术(如文本分类技术,文本聚类技术等)提供文本预处理工作,分词效果的好坏会直接影响到后续的处理过程,因此文本分词技术是文本挖掘过程中的
  3. 所属分类:Java

    • 发布日期:2013-07-02
    • 文件大小:494592
    • 提供者:u011272837
  1. 基于三维模型的人脸识别技术研究

  2. 本文主要针对三维人脸识别,在以下几个方面展开了研究工作: (1) 提出了一种基于轮廓线进行三角剖分的网格数据规格化处理的思路。同时,设计了一种三角形索引数据组织结构来组织三角网格,不仅减少了数据存储空间,也极大的方便了对人脸网格的各种操作。 (2) 提出利用人脸径向差分图和改进的高斯图进行人脸的边缘检测,采用区域生长来构造器官的轮廓区域,最后通过曲线拟合和能量优化精确定位人脸的主要特征点。 (3) 首次将人脸的曲线距离特征加入人脸的几何特征向量中,形成具有欧氏直线距离、曲线距离、角度和体积的特
  3. 所属分类:其它

    • 发布日期:2013-08-13
    • 文件大小:8388608
    • 提供者:a350203223
  1. 《计算语言学》讲义-中科院 刘群教授

  2. 中国科学院研究生院信息学院 硕士生课程 刘群教授主讲。 本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习,使同学掌握计算语言学的基本理论,了解自然语言处理的常用模型和算法,初步具备从事相关领域研究工作的能力。 内容提要: 第一章 概论 介绍计算语言学的研究对象,研究手段,学科特点,历史趋势等。 第二章 词典 词典编纂,组织,检索等。 第三章 语料库 语料库收集,整理,对齐,检索,基于语料库的知识获取。 第四章 词法分析 正则语法与有限状态自动机,HMM与词性标注,汉语词语切分,
  3. 所属分类:专业指导

    • 发布日期:2013-11-21
    • 文件大小:9437184
    • 提供者:yuhentian
  1. 空间向量模型源代码

  2. 可直接运行,利用空间向量模型建立简单的布尔检索,内含源代码与用于搜索的TXT文本,可以替换
  3. 所属分类:C++

    • 发布日期:2014-01-14
    • 文件大小:1048576
    • 提供者:u013201479
  1. 统计自然语言处理基础 中文版

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:其它

    • 发布日期:2014-02-13
    • 文件大小:26214400
    • 提供者:aaa939291641
  1. 空间向量模型

  2. 空间向量模型 信息检索作业 基于倒排索引
  3. 所属分类:C/C++

    • 发布日期:2014-04-02
    • 文件大小:6291456
    • 提供者:u011332819
  1. vsm向量空间模型并附带Lucene及相关文档

  2. 在MyEclipse上写的vsm,包括一个原始的还有两个改进版本,包含停用词词库及数据集并附带两个文档说明
  3. 所属分类:Java

    • 发布日期:2014-05-21
    • 文件大小:3145728
    • 提供者:a925907195
  1. 空间向量模型

  2. 该代码实现了信息组织与检索的空间向量模型,以文档管理形式实现。
  3. 所属分类:C/C++

    • 发布日期:2014-06-16
    • 文件大小:6291456
    • 提供者:skcaowenchao
  1. 基于C#的文本相似度检测源代码+说明

  2. 基于C#的文本相似度检测源代码+说明 向量空间模型文档相似度计算实现(C#)
  3. 所属分类:C#

  1. 稀疏贝叶斯模型相关向量机

  2. 相关向量机的MATLAB代码,经过验证是正确的,很实用 推荐相关向量机(Relevance vector machine,简称RVM)是Tipping在2001年在贝叶斯框架的基础上提出的,它有着与支持向量机(Support vector machine,简称SVM)一样的函数形式,与SVM一样基于核函数映射将低维空间非线性问题转化为高维空间的线性问题。 RVM原理步骤 RVM通过最大化后验概率(MAP)求解相关向量的权重。对于给定的训练样本集{tn,xn},类似于SVM , RVM 的模型输
  3. 所属分类:C

    • 发布日期:2015-08-27
    • 文件大小:17408
    • 提供者:lhyzguolei
  1. 文本分类特征选取技术研究

  2. 文介绍了文本分类的概念和向量空间模型,分类系统的性能评价参数与粗 糙集基本理论本分类特征选取技术研究
  3. 所属分类:讲义

  1. IR-model基础知识

  2. IR-model.包括概率模型 向量空间模型等的基础知识 看完很有启发!
  3. 所属分类:其它

    • 发布日期:2015-11-19
    • 文件大小:586752
    • 提供者:whiskey94945
  1. 文本相似度系统-java版本

  2. java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。
  3. 所属分类:Java

    • 发布日期:2017-01-20
    • 文件大小:48234496
    • 提供者:u013473512
« 1 2 3 4 5 67 8 9 10 11 ... 28 »