您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. LJCluster文本聚类技术中间件

  2. 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点*专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模的网络文本数据,
  3. 所属分类:网络基础

    • 发布日期:2010-03-09
    • 文件大小:1mb
    • 提供者:lingjoin
  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17mb
    • 提供者:lingjoin
  1. 纯净水安全监控的问题

  2. 纯净水安全监控问题 日趋加剧的水污染,已对人类的生存安全构成重大威胁,成为人类健康、经济和社会可持续发展的重大障碍。据世界权威机构调查,在发展中国家,各类疾病有8%是由于饮用了不卫生的水而传播的,每年因饮用不卫生水至少造成全球2000万人死亡,因此,水污染被称作"世界头号杀手"。 我国政府对纯净水安全问题十分重视,已将纯净水安全作为一项重要的公共管理目标,采取了一系列措施,强化纯净水安全的监管,并取得了初步成效。但纯净水安全问题的总体形势仍不容乐观,依然存在一系列隐忧,近年来食品安全方面的恶性
  3. 所属分类:专业指导

  1. 基于CRFs 的中文分词和短文本分类技术.pdf

  2. 本文的工作主要包括两部分:第一部分,我们借用了文本分类领域的特征选择算法对中文分词中的特征进行分析。分析结果表明,特征选择算法在中文分词的任务中也是适用的。在中文分词领域,基于字标注的方法得到广泛应用。通过字标注系统,中文分词任务被转换为序列标注任务,许多成熟的机器学习算法得以应用。评测结果表明,在众多的机器学习算法中,基于CRFs的分词器可以达到state-of-the-art的分词效果。CRFs分词器对于给出的每一个切分,都可以提供置信度。在本文中,我们深入调研了CRFs提供的置信度,在此
  3. 所属分类:其它

    • 发布日期:2011-01-04
    • 文件大小:1mb
    • 提供者:chwbin
  1. 短文本分析

  2. libshorttext-1.1.tar.gz 短文本分析
  3. 所属分类:IT管理

    • 发布日期:2014-04-22
    • 文件大小:799kb
    • 提供者:u013428116
  1. 短文本相似度计算在用户交互式问答系统中的应用

  2. 文本分析
  3. 所属分类:其它

    • 发布日期:2016-03-17
    • 文件大小:1mb
    • 提供者:java_pythoner
  1. 中文短文本分析资料打包

  2. 中文短文本分析资料打包,包括中文分词,深度学习,文本发掘等方向的入门论文等
  3. 所属分类:专业指导

    • 发布日期:2017-03-26
    • 文件大小:61mb
    • 提供者:wangyaninglm
  1. 短文本的情感分析

  2. 短文本情感分析,应用机器学习的方法与理论,优化过去文献的问题
  3. 所属分类:机器学习

    • 发布日期:2018-03-28
    • 文件大小:272kb
    • 提供者:carbon107
  1. 中文短文本情感分析语料 外卖评价

  2. 短文本情感分析语料,某外卖平台收集的用户评价,正负各8000条,共16000条
  3. 所属分类:机器学习

    • 发布日期:2018-02-02
    • 文件大小:386kb
    • 提供者:cstkl
  1. NLPCC2014任务1和任务2微博情感分析语料

  2. 任务1有14000条标注训练数据非常适合做微博短文本的情感分析。
  3. 所属分类:机器学习

    • 发布日期:2018-11-06
    • 文件大小:13mb
    • 提供者:m201672389
  1. 基于卷积记忆神经网络的微博短文本分析

  2. PDF格式。微博短文本情感分析的目的是发现用户对热点事件的观点及态度。已有的方法大多是基于词袋模型,然而,词袋模型 无法准确捕获带有情感倾向性的语言表现特征。结合卷积神经网络( CNN) 和长短期记忆网络( LSTM) 模型的特点,提出了卷 积记忆神经网络模型( CMNN) ,并基于此模型来解决情感分析问题。与传统算法相比,模型避免了具体任务的特征工程设计; 与 CNN 和LSTM 相比,模型既能够有效提取短文本局部最优特征,又能够解决远距离的上下文依赖。通过在COAE2014 数据集 上的实
  3. 所属分类:机器学习

    • 发布日期:2018-11-22
    • 文件大小:318kb
    • 提供者:weixin_39086917
  1. 网络大数据的文本内容分析

  2. 文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
  3. 所属分类:机器学习

    • 发布日期:2019-06-24
    • 文件大小:562kb
    • 提供者:janpychou111111
  1. 自然语言处理(NLP):08 PyTorch深度学习之TextCNN短文本分类

  2. 本章节主要研究内容:基于PyTorch 深度学习工具来完成短文本分类 知识点 业务需求 文本分类应用场景、技术方案以及挑战 技术架构 文本分析 词向量 CNN 原理 tensorboardX 可视化 项目实战: 基于TextCNN短文本分类,主要从数据预处理、构建此表、Embedding、模型训练、tensorboardX可视化以及在线服务几个重要的环境进行学习 文本分类应用场景 文章分类服务对文章内容进行深度分析,输出文章的主题一级分类、主题二级分类及对应的置信度,该技术在个性化推荐、文章聚合
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:591kb
    • 提供者:weixin_38663167
  1. 基于主题-关键词图的链接分析的短文本特征丰富

  2. 基于主题-关键词图的链接分析的短文本特征丰富
  3. 所属分类:其它

  1. 基于多重增强图和主题分析的社交短文本检索方法

  2. 基于多重增强图和主题分析的社交短文本检索方法
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:564kb
    • 提供者:weixin_38719564
  1. TextCluster:短文本聚类预处理模块-源码

  2. 短文本聚类 项目介绍 短文本聚类是常用的文本预处理步骤,可以用于洞察文本常见模式,分析设计语义解析规范,加速相似句子查询等。本项目实现了内存友好的短文本聚类方法,并提供了相似句子查询接口。 依赖库 点安装tqdm解霸 使用方法 聚类 python cluster.py --infile ./data/infile \ --output ./data/output 具体参数设置可以参考cluster.py文件内_get_parser()函数参数说明,包含设置分词词典,重置词,匹配采样数,匹配度阈值
  3. 所属分类:其它

  1. news-emotion::chart_decreasing:金融文本情感分析模型-源码

  2. 0.快速开始 挑战杯项目:金融文本情感分析模型|| 挑战杯项目:财务文本情感分析模型 金融领域短文本情感分析 配置要求: python 3.x 1.使用方法 1.0下载 sudo git clone https://github.com/AsuraDong/news-emotion.git news_emotion mv -R ./news_emotion/ 你的程序路径/ 1.1文件结构 clean_data / # 清洗数据 __init__ . py clean_html
  3. 所属分类:其它

  1. 网络大数据的文本内容分析

  2. 文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
  3. 所属分类:其它

  1. 基于子语义空间的挖掘短文本策略方法

  2. 为解决精准识别短文本数据的问题,提出一种基于子语义空间的短文本策略挖掘方法。该方法首先采用语义空间技术,解决短文本在分析过程中存在的“词汇鸿沟”与“数据稀疏”问题;然后基于聚类算法将语义空间划分为多个子语义空间,在各子语义空间并行挖掘关联规则,提高了策略生成的效率与质量;最后利用二叉树进行策略归并,生成最简策略集。实验证明,与传统的分类模型相比,该方案生成的策略集在误报率为6.5%的情况下,准确率可达88%。在违规短信的发现处理中,使用该技术挖掘的策略集,覆盖能力强、准确率高,具有很强的实用性。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:748kb
    • 提供者:weixin_38560797
  1. 基于层次分析的微博短文本特征计算方法

  2. 为了建立用户精准兴趣模型以有效发现具有相似兴趣的用户群,提出了一种针对微博的短文本特征计算方法用于聚类算法,提升聚类效果以更好地挖掘微博用户的相似兴趣集合。该方法融合了微博转发数、评论数、点赞数等多个关键指标来度量微博短文本特征的重要性。同时,引入层次分析技术,改进了传统的tf-idf特征计算方法,并利用经典文本聚类算法进行实验。实验结果表明,改进后的短文本特征计算方法与传统的tf-idf特征计算方法相比,在类内集中度和类间分散度上取得了更好的效果。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:614kb
    • 提供者:weixin_38565801
« 12 »