您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于DPI的用户兴趣实时分类

  2. 近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商研究的热点。设计了一种基于混合n-gram特征的URL分类算法和基于Doc2Vec模型的文本分类算法相结合的DPI数据分类方法,大大提高了DPI数据的分类速度和分类准确率,为电信运营商进行精准营销提供了良好的基础。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38627590
  1. 基于特征融合的层次结构微博情感分类

  2. 情感分类是观点挖掘的热点研究之一,微博文本情感分类具有很高的应用价值。鉴于传统特征选择方法存在语义缺陷,采用神经网络语言模型,提出了基于概率模型的对词向量进行权重分配的深层特征表示方法,构建文本语义向量。将文本深层特征与浅层特征融合,构建融合语义信息的特征向量,弥补传统特征选择方法语义的缺陷。采用SVM层次结构分类模型,实现多种情感分类。实验结果表明,采用特征融合的层次结构情感分类方法,能有效提高微博情感分类的准确率。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38603259
  1. 基于层次分析的微博短文本特征计算方法

  2. 为了建立用户精准兴趣模型以有效发现具有相似兴趣的用户群,提出了一种针对微博的短文本特征计算方法用于聚类算法,提升聚类效果以更好地挖掘微博用户的相似兴趣集合。该方法融合了微博转发数、评论数、点赞数等多个关键指标来度量微博短文本特征的重要性。同时,引入层次分析技术,改进了传统的tf-idf特征计算方法,并利用经典文本聚类算法进行实验。实验结果表明,改进后的短文本特征计算方法与传统的tf-idf特征计算方法相比,在类内集中度和类间分散度上取得了更好的效果。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:628736
    • 提供者:weixin_38565801
  1. 基于预训练机制的自修正复杂语义分析方法

  2. 面向知识服务过程中内容资源的智能化、知识化、精细化和重组化的碎片性管理需求。深层分析并挖掘语义隐层知识、技术、经验与信息,突破已有传统文本到结构化查询语言(SQL)的语义分析技术瓶颈,提出基于预训练机制的自修正复杂语义分析方法PT-Sem2SQL。设计结合Kullback-Leibler差异技术的MT-DNN预训练机制,以加强上下文语义理解深度;设计专有增强模块,捕获句内上下文语义信息的位置;并通过自修正方法优化生成模型的执行过程,以解决解码过程中的错误输出。实验结果表明,PT-Sem2SQL
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:1048576
    • 提供者:weixin_38606041
  1. 基于张量的XML相似度计算方法

  2. 扩展标记语言(XML) 带有一定的结构和语义信息, 与普通文本相比, XML具有描述精确、表现形式丰富等特点, 但同时也使得传统的自然语言处理和数据挖掘等技术不能直接应用. 根据XML内容和结构并非独立, 内容影响结构, 结构作用于内容, 提出一种基于张量的XML特征降维及综合相似度计算方法. 针对XML文档, 使用张量表示并采用基于最大互信息的方法对其进行降维, 采用将XML结构和内容相融合的综合相似度度量方法确定结构和内容的内在联系及共同作用方式, 提高XML综合相似度计算性能. 实验及结果
  3. 所属分类:其它

    • 发布日期:2021-01-13
    • 文件大小:164864
    • 提供者:weixin_38689113
  1. 基于学习型哈希的在线近邻查找算法

  2. 基于哈希的近邻查找技术在图像检索、文本匹配、数据挖掘等信息检索领域均有广泛应用.该技术将原始数据通过哈希函数压缩成低维的二进制编码,然后在海明距离下排序检索,具有快速高效且维度不敏感的优势.但是,目前学术界针对流数据的实时在线哈希学习方法的研究很少,而且基本没有讨论哈希函数的更新频率和稳定性问题.针对这一问题,通过增加置信区间来减少更换哈希函数的频率,并构造在线学习的目标函数,使得算法尽可能保持稳定,且快速收敛.为了验证所提出算法的效率和有效性,在公开数据集上与同类的OSH、OKH在线哈希算法进
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:293888
    • 提供者:weixin_38621365
  1. data-mining-project-2-源码

  2. 项目2:人在环 一种数据挖掘类型是协助人们处理大量数据。 所谓的“环环相扣”流程通常通过利用机器学习模型来工作,这些模型可帮助确定相关信息的优先级并消除不太可能的选择。 例如,一个逻辑回归可以识别候选服装客户,他们可能会喜欢给定他们的年龄,性别,位置和过去的选择,而设计师会做出最终选择(例如Stitchfix在内部进行类似的选择)。 该项目的目标是让您通过人在回路模型对文本数据执行数据挖掘。 特别是,要求您通过职务说明进行挖掘,以识别与给定简历相关的前3名职务说明。 激励性的例子是在不要求学生
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:201326592
    • 提供者:weixin_42122988
  1. 基于语义角色标注的专利主题提取研究

  2. 主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动 提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语 义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综 合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而 证实本研究的实用价值。
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:1048576
    • 提供者:weixin_38650629
  1. GIS-PythonScripts-源码

  2. GIS-Python脚本 带有GIS应用程序的Python脚本 这些是我在使用ArcGIS Pro时修改和使用的脚本。 如果要使用这些脚本,则可能必须更改脚本以满足您的要求。 CBYD DB Builder: 该脚本获取Microsoft Exchange附件,转换为文本文件,存储所述文件,然后抓取有关“挖掘之前致电”票证的重要信息。 CBYD成分: 该脚本将从CBYD DB Builder脚本中获取Excel文件并生成点,然后将点上传到ArcGIS Online。 它只需要最近30天的
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:6144
    • 提供者:weixin_42117485
  1. 通过他们转发的微博识别有影响力的用户职业

  2. 对于大多数社交媒体网站,如何发现(有影响的)用户职业是一项重要的任务。 通过挖掘用户生成的文本内容或分析社交网络结构,已经进行了许多工作来探索此任务。 在本文中,我们仅通过检查有影响力的用户转发了哪些微博消息,从而创新地解决了该任务。 首先,我们根据两种标准定义热门微博消息,并从大量候选消息中识别出它们。 每个标识的消息都指向一个特定的热点事件。 接下来,我们根据相似的热消息的词相似性,语义相似性和转发者的相似性将它们组合在一起。 最后,我们用转发的热门消息代表用户,并设计一种识别方法来识别他们
  3. 所属分类:其它

    • 发布日期:2021-03-27
    • 文件大小:463872
    • 提供者:weixin_38700240
  1. credential-digger:Github扫描工具,可识别硬编码的凭据,同时通过机器学习模型过滤误报数据-源码

  2. 证书挖掘者 Credential Digger是一个GitHub扫描工具,可识别硬编码的凭据(密码,API密钥,秘密密钥,令牌,个人信息等),并通过机器学习模型过滤误报数据。 TLDR;观看视频 :down_arrow: 为什么 在数据保护中,最关键的威胁之一由开源项目中的硬编码(或纯文本)凭据表示。已经有几种工具可用于检测开源平台中的泄漏,但是凭据的多样性(取决于多种因素,例如编程语言,代码开发约定或开发人员的个人习惯)是这些工具有效性的瓶颈。他们缺乏精确性,导致大量代码被错误地检测为泄露的
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:778240
    • 提供者:weixin_42101056
  1. machine_learning_stanford_coursera-源码

  2. Machine_Learning_Stanford_Coursera 该存储库包含我在斯坦福大学(Coursera)的机器学习课程中必须完成的编程任务的解决方案。 (解决方案在Octave中完成) 本课程对机器学习,数据挖掘和统计模式识别进行了广泛的介绍。主题包括:(i)有监督的学习(参数/非参数算法,支持向量机,内核,神经网络)。 (ii)无监督学习(聚类,降维,推荐系统,深度学习)。 (iii)机器学习的最佳实践(偏差/方差理论;机器学习和AI的创新过程)。本课程还将借鉴大量案例研究和应用
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:30408704
    • 提供者:weixin_42173218
« 1 2 ... 42 43 44 45 46 47»