您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. giza++代码解析

  2. giza++GIZA++实现了IBM模型1~5以及hmm模型的所有代码,在生成源语言与目标语言之间翻译概率的同时,也产生相应的副产品——“词对齐”。这里主要对GIZA++开源代码中的IBM 模型1模型2实现部分进行总结,同时对词对齐技术进行简单的介绍。
  3. 所属分类:C/C++

    • 发布日期:2012-07-09
    • 文件大小:192512
    • 提供者:minger8793
  1. 统计自然语言处理基础

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:专业指导

    • 发布日期:2012-07-26
    • 文件大小:26214400
    • 提供者:a06062125
  1. 基于词典和统计的语料库词汇级对齐算法_刘小虎

  2. 基于词典和统计的语料库词汇级对齐算法_刘小虎
  3. 所属分类:其它

    • 发布日期:2013-09-12
    • 文件大小:254976
    • 提供者:yy123hefei
  1. 统计自然语言处理基础 中文版

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:其它

    • 发布日期:2014-02-13
    • 文件大小:26214400
    • 提供者:aaa939291641
  1. 利用统计搭配模型改进基于实例的机器翻译

  2. 基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT 系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3 个方面提高EBMT 的性能:(1) 利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度
  3. 所属分类:管理软件

    • 发布日期:2014-02-28
    • 文件大小:741376
    • 提供者:u013822151
  1. 2万条词对齐的双语句子对

  2. 2万条词对齐的双语句子对 研究方向:自然语言,人工智能
  3. 所属分类:其它

    • 发布日期:2014-08-26
    • 文件大小:6291456
    • 提供者:chobits17
  1. giza++及模型代码解析

  2. 该资源主要用于机器翻译,解决多语言翻译间的词对齐,具体包含: 1.giza-pp-v1.0.7.tar.gz 2.giza模型代码解析
  3. 所属分类:深度学习

    • 发布日期:2018-04-03
    • 文件大小:271360
    • 提供者:u013614465
  1. 华尔街日报沙中英文双语对齐资源

  2. 手工调整过的华尔街日报的双语对齐资源,约8500句,已手工对齐。适合机器翻译做数据集
  3. 所属分类:机器学习

    • 发布日期:2018-01-19
    • 文件大小:2097152
    • 提供者:yanmengqi0
  1. synonyms中文近义词工具包

  2. synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
  3. 所属分类:其它

    • 发布日期:2019-08-08
    • 文件大小:47185920
    • 提供者:weixin_39840914
  1. Python-synonyms中文近义词工具包

  2. synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
  3. 所属分类:其它

    • 发布日期:2019-08-12
    • 文件大小:61865984
    • 提供者:weixin_39841856
  1. 使用双重分解的联合词对齐和双语命名实体识别

  2. 使用双重分解的联合词对齐和双语命名实体识别
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:417792
    • 提供者:weixin_38535848
  1. Ksearch:thinkphp分词全文检索全文搜素,利用PullWord分词接口。-源码

  2. 搜索 thinkphp分词全文检索全文搜素,利用PullWord分词接口。对齐TNTSearch数据库思路。精确匹配结果。 简单调用建议分页查询,每篇长文章,几千句话不是闹着玩的。 安装htmlpurifier $作曲家需要ezyang / htmlpurifier <?php namespace app\search\controller; use think\Controller; use think\Request; use think\Db; use Ksearch\Ksea
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:7168
    • 提供者:weixin_42181545
  1. 基于词对齐模型的在线评论中共提取意见目标和意见词

  2. 基于词对齐模型的在线评论中共提取意见目标和意见词
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_38700779
  1. 中老双语命名实体对位研究

  2. 中老双语NE对齐具有非常重要的意义。 本文提出了三种实体对齐方法。 首先,提出了双语实体模糊匹配问题的相似性。 其次,我们采用双语实体词序列模式相似度提出中文实体模型来匹配老挝实体方法。 然后,通过挖掘中文实体的知识信息词,建立了朴素的贝叶斯双语NE对齐模型,以在可比语料库中对齐中文和老挝命名实体。 最后,结合三种方法的优点提出了规则,以达到最佳效果。
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:117760
    • 提供者:weixin_38621150
  1. 维吾尔语不同词尾粒度对维汉词对齐的影响

  2. 维吾尔语不同词尾粒度对维汉词对齐的影响
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:347136
    • 提供者:weixin_38557768
  1. 基于词向量一致性融合的遥感场景零样本分类方法

  2. 遥感场景类别的语义词向量与图像特征原型的距离结构不一致问题,严重影响遥感场景零样本分类效果。针对该问题,利用不同词向量间一致性,提出一种基于解析字典学习的语义词向量融合方法,以提升遥感场景零样本分类效果。首先,采用解析字典学习方法,提取场景类别的不同词向量的公共稀疏系数,并作为融合后的语义词向量;然后,同样采用解析字典学习方法,将场景类别的图像特征原型嵌入到融合后的词向量空间,与融合后的词向量进行结构对齐,降低距离结构的不一致性;最后,通过联合优化获得未知类的图像特征空间类别原型表示,并采用最近
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:19922944
    • 提供者:weixin_38674415
  1. 子句对齐及其在专利统计机器翻译中的应用

  2. 针对专利文献句子偏长的特点,将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来生成子句对齐,建立基于简单子句的双语语料来重新训练统计机器翻译系统,在一定程度上改善了原有双语训练语料中的短语对齐和词对齐,可以更为深入地利用平行语料中蕴含的翻译信息,应用于专利统计机器翻译中,在NTCIR-9的测试集上进行实验比较,获得较为满意的翻译效果。
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:1003520
    • 提供者:weixin_38529436
  1. CrossLingualContextualEmb:上下文单词嵌入的跨语言对齐-源码

  2. 跨语言ELMo 上下文词嵌入的跨语言对齐 此存储库将包含NAACL19论文的代码和模型- 不久将发布更多代码。 更新: 计算英语锚点(以帮助计算更多语言的对齐方式) ELMO所有层的对齐矩阵。 现在提供了用于计算BERT模型锚的脚本。 多语言ELMo现在已合并到(版本> = 0.8.5)。 可以使用此处的代码来计算其他模型的锚。 我们正在努力将多语言ELMo合并到AllenNLP框架。 希望我们能尽快完成。 现在可以在此使用多语言解析器代码(此requirements.txt
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:16384
    • 提供者:weixin_42109125
  1. VSUA字幕:“用于对齐语言文字和视觉语义单元以进行图像字幕的代码”,ACM MM 2019-源码

  2. 介绍 VSUA模型将图像表示为结构化图,其中的节点是所谓的视觉语义单位(VSU):对象,属性和关系单位。 我们的VSUA模型利用了字幕词和VSU之间的对齐方式。 引文 如果您发现此代码对您的研究有用,请引用 inproceedings{guo2019vsua, title={Aligning Linguistic Words and Visual Semantic Units for Image Captioning}, author={Longteng Guo, Jing Liu, Jin
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:193536
    • 提供者:weixin_42131785
  1. 同义词:中文近义词:聊天机器人,智能问答工具包-源码

  2. 同义词 用于自然语言处理和理解的中文同义词。 更好的中文近义词:聊天机器人,智能问答工具包。 synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义转换,关键字提取,概念提取,自动摘要,搜索引擎等。 表中的内容: 欢迎 pip install -U synonyms 兼容py2和py3,当前稳定版本 提示:安装后初次使用会下载词向量文件,下载速度取决于网络情况。 本文档的配置和接口说明针对python工具包。 用法 支持使用环境变量配置分词词表和word2vec词
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:14680064
    • 提供者:weixin_42109125
« 12 3 4 5 »