您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 句向量学习笔记

  2. 句向量学习笔记
  3. 所属分类:深度学习

    • 发布日期:2017-06-09
    • 文件大小:230kb
    • 提供者:baoyan2015
  1. doc2vec训练与相似度计算.rar

  2. 相似度计算,句向量,人工智能,文本抽取,深度学习,
  3. 所属分类:深度学习

    • 发布日期:2019-05-21
    • 文件大小:45kb
    • 提供者:qq_41007998
  1. 智能问答算法原理及实践之路

  2. 高清版,智能问答算法原理及实践之路CONTENTS 01 智能问答算法原理 02 实践:小知客服机器人电话机器人 03 总结和挑战 腾讯小知 总览 query 中控逻辑 response 任务机器人 知识图谱机器人 FAQ机器人 闲聊机器人 阅读理解机器人 KNOWLEDGE GRAPH AQ豆豆 腾讯小知 腾讯小知 FAQ机器人 Preprocess:对 query进行预处理,抽取NLP特征 社保余额 怎么查询? 纠错 标准化文本特征提取 FAQ问题集 Retrieval:从问题索引中召回
  3. 所属分类:机器学习

  1. Python-自然语言处理闲聊机器人BERT句向量相似度文本分类数据增强

  2. 闲聊机器人(chatbot),BERT句向量-相似度(Sentence Similarity),文本分类(Text classify) 数据增强(text augment enhance),同义句同义词生成,句子主干提取(mainpart),中文汉语短文本相似度,文本特征工程,keras-http-service调用
  3. 所属分类:其它

  1. Python-BERT生成句向量BERT做文本分类文本相似度计算

  2. 本文基于Google开源的BERT代码进行了进一步的简化,方便生成句向量与做文本分类
  3. 所属分类:其它

  1. yelp13.rar

  2. yelp13数据集 附带用户、产品attention embedding 已经过处理,可直接使用embedding数据进行层次化lstm训练,可执行情感分类任务。 通过层级化的LSTM获得文本embedding表示,通过注意力机制在不同语义层级引入用户信息和产品信息,根据词向量与句向量的语义关系对隐层节点初始权重进行赋值,最后将获得语义作为文本特征进行情感分类。
  3. 所属分类:深度学习

    • 发布日期:2020-05-02
    • 文件大小:42mb
    • 提供者:u011748542
  1. 句子相似度评估数据集

  2. 句子相似度数据,可用于评估词向量、句向量的优劣,句子成对出现,有人工的相似度打分
  3. 所属分类:深度学习

    • 发布日期:2019-01-12
    • 文件大小:400kb
    • 提供者:sinat_38269823
  1. 基于Sword2vect的中文在线商品评价情感分析

  2. 商品的在线评论情感分析已经成为一个热门的研究话题。为了更好地解决情感分析中 词语的上下文信息和词语的情感信息缺失问题,提出了一种基于句子情感得分加权句向量的 Sword2vect情感分析方法,对中文在线评价进行情感分析。首先用基于词典的方法计算出评论 句子的情感得分并对其进行预处理保证所有正向评论句子的情感得分为正,负向评论情感得分 为负,用word2vect算法得到含有上下文信息评论的句子向量,然后用情感得分对句子向量进行 加权得到情感句向量Sword2vect ,用支持向量机算法对训练数据集
  3. 所属分类:其它

  1. yahoo answer scv dataset

  2. 模型结构很简单,文本输入x,先进行embedding,然后将整句话的每个单词向量计算平均值,最后接fc+softmot进行分类。官方论文中的关键点: 1)不使用预训练word2vec,直接利用标签样本进行学习词嵌入矩阵,也许是因为我们最终要通过对词向量做平均得到句向量,所以不追求单个词向量性能? 2)fc隐层输出可作为句向量,供其他任务使用;
  3. 所属分类:深度学习

    • 发布日期:2020-11-12
    • 文件大小:304mb
    • 提供者:zhaolanyi
  1. amozn dataset fasttext

  2. 模型结构很简单,文本输入x,先进行embedding,然后将整句话的每个单词向量计算平均值,最后接fc+softmot进行分类。官方论文中的关键点: 1)不使用预训练word2vec,直接利用标签样本进行学习词嵌入矩阵,也许是因为我们最终要通过对词向量做平均得到句向量,所以不追求单个词向量性能? 2)fc隐层输出可作为句向量,供其他任务使用;
  3. 所属分类:深度学习

    • 发布日期:2020-11-12
    • 文件大小:656mb
    • 提供者:zhaolanyi
  1. 论文阅读:基于多模态词向量的语句距离计算方法

  2. 论文信息 文章来源:cnki.net 添加链接描述 文章类别,发表时间 华阳. 基于多模态词向量的语句距离计算方法[D].哈尔滨工业大学,2018. 摘要 摘要分三段,大致阐述了本文的出发点和工作内容,基本情况如下: 简述语句间的距离问题:自然语言处理任务是度量文本间的距离;不同阶段语言学习的难度可以抽象为距离,本文探索语句间的距离。 从两个角度阐述传统词向量距离的缺陷:基于纯文本语料的词向量构建,与人类通过多种感官途径接受信息不符;传统的多模态词向量通过拼接词向量与图像特征略显粗糙。本文提出了
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:48kb
    • 提供者:weixin_38705723
  1. SIFRank_zh:基于预训练模型的中文关键词提取方法(论文SIFRank-源码

  2. SIFRank_zh 这是我们论文的相关代码原文是在对英文关键短语进行抽取,这里迁移到中文上,部分管道进行了改动英文原版在。。 版本介绍 2020/03 / 03——最初最初版本本版本中只包含了最基本的功能,部分细节还有待优化和扩展。 核心算法 预训练模型ELMo +句向量模型SIF 词向量ELMo优势:1)通过大规模预训练,较早的TFIDF,TextRank等基于统计和图的具有更多的语义信息; 2)ELMo是动态的,可以改善一词多义问题; 3)ELMo通过Char -CNN编码,对生隐词非常友
  3. 所属分类:其它

  1. 基于多元判别分析的汉语句群自动划分方法

  2. 针对目前句群划分工作缺乏计算语言学数据支持、忽略篇章衔接词的问题以及当前篇章分析较少研究句群语法单位的现象,提出一种汉语句群自动划分方法。该方法以汉语句群理论为指导,构建汉语句群划分标注评测语料,并且基于多元判别分析(MDA)方法设计了一组评价函数J,从而实现汉语句群的自动划分。实验结果表明,引入切分片段长度因素和篇章衔接词因素可以改善句群划分性能,并且利用Skip-Gram Model比传统的向量空间模型(VSM)有更好的效果,其正确分割率Pμ达到85.37%、错误分割率Window Diff
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:317kb
    • 提供者:weixin_38656676
  1. 利用机器学习进行比较句提取

  2. 本文研究了从用户评论中提取中文比较句的问题,这是句子层次上的文本分类问题。 本文首先研究了评论数据的类偏斜问题,然后构建了一个SVM(支持向量机)模型,将比较和不比较的句子分类到一个平衡的数据集上的不同组中。 引入了各种语言和统计特征来表征句子。 对用户生成的产品评论进行了实验。 结果,我们的实验显示出显着的性能,整体F分数为85.87%。
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:444kb
    • 提供者:weixin_38628175
  1. 推文的汉语比较句的学习提取

  2. 随着Web 2.0的普及,人们越来越喜欢表达意见并通过CGM(消费者生成的媒体)交换信息,例如博客,互联网论坛等。许多研究关注提取和分析消费者中的用户意见评论。 本文研究如何自动从中提取汉语比较句消费者评论。 首先,本文描述了一种解决班级失衡的方法评论数据中的可比性和非可比性问题。 然后我们建立了一个支持向量机学习模型,将比较对象和非比较对象分类为不同的对象在平衡的数据集上分组。 对消费者生产的产品进行了实验评论,包括9600个句子,其中1,624个(占总数的16.92%)是比较。 实验表明,整
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:202kb
    • 提供者:weixin_38522214
  1. 基于BootStrapping的集成分类器的中文观点句识别方法

  2. 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。
  3. 所属分类:其它

  1. nlp_xiaojiang:自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT语法向量-相似度(句子相似度),XLNET语法向量-相似度(文本xlnet嵌入),文本分类(文本分类),实体提取(ner,bert + bi

  2. nlp_xiaojiang AugmentText - 回译(效果比较好) - EDA(同义词替换、插入、交换和删除)(效果还行) - HMM-marko(质量较差) - syntax(依存句法、句法、语法书)(简单句还可) - seq2seq(深度学习同义句生成,效果不理想,seq2seq代码大都是 [https://github.com/qhduan/just_another_seq2seq] 的,效果不理想) 聊天宝 - 检索式ChatBot - 像ES那样直接检索(如使用fuz
  3. 所属分类:其它

  1. caiss:跨平台多语言的相似向量相似词相似句高效检索引擎。功能强大,使用方便。欢迎star&fork,周末可以要求提供支持服务-源码

  2. Caiss说明文件 一。简介 随着人工智能技术的普及,海量高维度向量的相似度查询技术在研究和生产中的作用和存在与日俱增。结果,市面有很多优秀开源的解决方案,但是,在使用过程中遇到了一些问题,样本: 由于针对各种算法原理的了解不深,不会调整参数,导致的训练模型结果偏差贯通。 开源库对于各种距离的支持有限,无法满足随时变化的实验需求。 标签信息和向量的分离,导致标记和查询需要在不同的步骤中完成。 功能不够全面,无法覆盖日常需要的“增删改查”功能。 部分解决方案,对于平台或对于编程语言的依赖,导致了各
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:18mb
    • 提供者:weixin_42137723
  1. OpenCV机器学习——支持向量机SVM

  2. OpenCV中集成了多种机器学习算法供我们方便使用,如果我们要训练数据进行分类,不用自己写分类器,只需要调用相应的库和类即可轻松实现。本文重点不在于介绍机器学习原理及数学推导,着重介绍OpenCV中的机器学习相关函数,并且用十分简单的训练数据作为例子实现分类。 对于OpenCV的机器学习分类器,大多换汤不换药,构造方法和实现方法很类似,基本遵循原始数据—训练分类器—进行分类的步骤,某些算法可能有特殊的初始化参数,需要额外设置在实现任何分类器之前,都需要训练数据。插句题外话,训练数据的好坏是一个分
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:80kb
    • 提供者:weixin_38603936
  1. 对Python中一维向量和一维向量转置相乘的方法详解

  2. 在Python中有时会碰到需要一个一维列向量(n*1)与另一个一维列向量(n*1)的转置(1*n)相乘,得到一个n*n的矩阵的情况。但是在python中, 我们发现,无论是“.T”还是“np.transpose”都无法实现一维向量的转置,相比之下,Matlab一句“ a’ ”就能实现了。 那怎么实现呢?我找了个方法。请看: 即,我们把向量reshape一下,如此便实现了一维向量与一维向量转置相乘为矩阵的目的。 若大家有其他方法望告知。 以上这篇对Python中一维向量和一维向量转置相乘的方法
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:78kb
    • 提供者:weixin_38614417
« 12 3 4 5 »