您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3mb
    • 提供者:vcfriend
  1. C语言、Python实现TF-IDF算法

  2. 该资源属于代码类,用C语言和Python实现了TF-IDF算法,适用于文本分类等特征权重抽取
  3. 所属分类:C

    • 发布日期:2015-11-01
    • 文件大小:3kb
    • 提供者:blinkhow
  1. 基于selective_search对手写数字串进行分割,并基于tensorflow在mnist训练好的模型进行识别

  2. 基于selective_search源码对手写数字串进行过滤分割,并基于tensorflow在mnist训练好的模型进行识别。 环境:Windows10 + tensorflow1.2 + python3.5 + cv2 程序: example/demo.py---对手写数字图片的分割,并将每个数字做成28*28的黑底白字图片,保存在本地image_data.npy example/mnist_model.py---对手写体mnist数据集进行训练,训练好后读取数据进行识别 example/c
  3. 所属分类:深度学习

    • 发布日期:2017-08-03
    • 文件大小:49kb
    • 提供者:flyyoung0709
  1. spark mllib 文本特征提取

  2. 里面包含四种模型(word2vec TF-IDF LDA CountVectorizer) 的helloworld代码和模型简单介绍,都是基于spark mllib的,包含python版本、scala版本和java版本的,是我运行通过后,整理成pdf的。这些代码没有问题,一般运行在linux上 python需要pip install 工具包来下载相应工具,一般出错出在操作系统不对和工具包没有下载
  3. 所属分类:spark

  1. 基于分布式数据库的图像检索系统

  2. DIRS: Distributed Image Retrieval System === 本项目实现了基于分布式数据库的图像检索系统。其中,TF-IDF作为相似度依据,MapReduce+HBase作为分布式框架。 集群配置 --- 4个节点:1个Master,3个Slave,均运行64位Centos系统 运行环境 --- Hadoop:2.7.3 Hbase:1.2.3 python 2.7.3 java 1.8.0 系统架构 --- 1. **分布式存储** 使用了HBase表存储图片信息
  3. 所属分类:图像处理

    • 发布日期:2018-06-25
    • 文件大小:462.01kb
    • 提供者:oceandreami
  1. python实现knn、naive bayes、vsm、tf-idf模型(包含数据集)

  2. python实现knn、naive bayes、vsm、tf-idf模型。并包含数据集
  3. 所属分类:机器学习

    • 发布日期:2019-06-11
    • 文件大小:40mb
    • 提供者:zzhao114
  1. 主题模型Python工具包Gensim.zip

  2. Gensim是一个相当专业的主题模型Python工具包。在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感*彩,比较注重描述商品的属性和特性,角度更客观。gensim就是  Python 里面计算文本相似度的程序包。示例代码:针对商品评论和商品描述之间的相似度,怎么使用gensim来计算?原理1、文本相似度计算的需求始于搜索引擎。搜索引擎需要计算“用户查询”和爬下来的众多”网页
  3. 所属分类:其它

    • 发布日期:2019-07-18
    • 文件大小:41mb
    • 提供者:weixin_39841848
  1. Python-利用Python实现中文文本关键词抽取分别采用TFIDFTextRankWord2Vec词聚类三种方法

  2. 利用Python实现中文文本关键词抽取,分别采用TF-IDF、TextRank、Word2Vec词聚类三种方法。
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:888kb
    • 提供者:weixin_39840650
  1. Python-一个简单的基于seq2seq模型的chatbot对话系统的tensorflow实现

  2. 基于seq2seq模型的简单对话系统的tf实现,具有embedding、attention、beam_search等功能,数据集是Cornell Movie Dialogs
  3. 所属分类:其它

  1. Python实现简单的文本相似度分析操作详解

  2. 本文实例讲述了Python实现简单的文本相似度分析操作。分享给大家供大家参考,具体如下: 学习目标: 1.利用gensim包分析文档相似度 2.使用jieba进行中文分词 3.了解TF-IDF模型 环境: Python 3.6.0 |Anaconda 4.3.1 (64-bit) 工具: jupyter notebook 注:为了简化问题,本文没有剔除停用词“stop-word”。实际应用中应该要剔除停用词。 首先引入分词API库jieba、文本相似度库gensim import jieba
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:70kb
    • 提供者:weixin_38583286
  1. python使用TensorFlow进行图像处理的方法

  2. 一、图片的放大缩小 在使用TensorFlow进行图片的放大缩小时,有三种方式: 1、tf.image.resize_nearest_neighbor():临界点插值 2、tf.image.resize_bilinear():双线性插值 3、tf.image.resize_bicubic():双立方插值算法 下面是示例代码: # encoding:utf-8 # 使用TensorFlow进行图片的放缩 import tensorflow as tf import cv2 import
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:48kb
    • 提供者:weixin_38577261
  1. 浅谈tensorflow1.0 池化层(pooling)和全连接层(dense)

  2. 池化层定义在tensorflow/python/layers/pooling.py. 有最大值池化和均值池化。 1、tf.layers.max_pooling2d max_pooling2d( inputs, pool_size, strides, padding='valid', data_format='channels_last', name=None ) inputs: 进行池化的数据。 pool_size: 池化的核大小(pool_height, p
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:46kb
    • 提供者:weixin_38633897
  1. 学习NLP的第10天——文章关键词提取:词频统计

  2. 关键词提取是词语颗粒度的信息抽取的一种重要的需求,即提取文章中重要的词语。 关键词提取的常用方法包括词频统计、TF-IDF和TextRank等。 其中,词频和TextRank属于单文档算法,即只需一篇文章即可提取出其中的关键词;而TF-IDF则属于多文档宣发,需要其他文档的辅助来提取当前文章的关键词。 词频统计的Python实现 词频统计的逻辑是:在一篇文章中,越重要的关键词往往会在文章中反复出现;因为为了解释关键词,作者经常会反复地提及它们。所以通过统计文章中各个词语的出现频率,即可初步地获得
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:59kb
    • 提供者:weixin_38653602
  1. Tensorflow 1.0之后模型文件、权重数值的读取方式

  2. 保存的文件有4个: checkpoint model-parameters.bin-46000.data-00000-of-00001 model-parameters.bin-46000.index model-parameters.bin-46000.meta 读取代码: from tensorflow.python import pywrap_tensorflow with tf.Graph().as_default(): with tf.Session() as sess:
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:26kb
    • 提供者:weixin_38622962
  1. python数字图像处理--包的安装、读取、显示和简单处理

  2. 选择skimage包,里面提供了io模块,用来图片的输入输出我的Windows由于TensorFlow环境关系,安装了python3.7.1和3.6两个版本,IDLEspyder同样,因此这里我就都给安装了。【1】3.7.1的skimage安装功能键+R,打开窗口,再打开CMD命令行窗口用pip安装:pipinstallskimage系统提示,installscikit-iamge,说明这个是完整的名pipinstallscikit-image---安装成功验证:进入python环境,impor
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:760kb
    • 提供者:weixin_38599545
  1. 从系统和代码实现角度解析TensorFlow的内部实现原理

  2. 本文来自于leiphone.com,本文由浅入深的阐述Tensor和Flow的概念。先介绍了TensorFlow的核心概念和基本概述,然后剖析了OpKernels模块、Graph模块、Session模块。2015年11月9日,Google发布深度学习框架TensorFlow并宣布开源,并迅速得到广泛关注,在图形分类、音频处理、推荐系统和自然语言处理等场景下都被大面积推广。TensorFlow系统更新快速,官方文档教程齐全,上手快速且简单易用,支持Python和C++接口。本文依据对Tensorf
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:416kb
    • 提供者:weixin_38631599
  1. Python利用逻辑回归模型解决MNIST手写数字识别问题详解

  2. 本文实例讲述了Python利用逻辑回归模型解决MNIST手写数字识别问题。分享给大家供大家参考,具体如下: 1、MNIST手写识别问题 MNIST手写数字识别问题:输入黑白的手写阿拉伯数字,通过机器学习判断输入的是几。可以通过TensorFLow下载MNIST手写数据集,通过import引入MNIST数据集并进行读取,会自动从网上下载所需文件。 %matplotlib inline import tensorflow as tf import tensorflow.examples.tutor
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:327kb
    • 提供者:weixin_38678172
  1. python 中值滤波,椒盐去噪,图片增强实例

  2. 受光照、气候、成像设备等因素的影响,灰度化后的图像存在噪声和模糊干扰,直接影响到下一步的文字识别,因此,需要对图像进行增强处理。图片预处理中重要一环就是椒盐去澡,通常用到中值滤波器进行处理,效果很好。中值滤波器是一种非线性滤波器,其基本原理是把数字图像中某点的值用其领域各点值的中值代替。 如求点[i,j]的灰度值计算方法为: (1)按灰度值顺序排列[i,j]领域中的像素点; (2)取排序像素集的中间值作为[i,j]的灰度值。中值滤波技术能有效抑制噪声。 直接上代码,希望给大家有帮助: imp
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:96kb
    • 提供者:weixin_38667835
  1. Python基于Tensor FLow的图像处理操作详解

  2. 本文实例讲述了Python基于Tensor FLow的图像处理操作。分享给大家供大家参考,具体如下: 在对图像进行深度学习时,有时可能图片的数量不足,或者希望网络进行更多的学习,这时可以对现有的图片数据进行处理使其变成一张新的图片,在此基础上进行学习,从而提高网络识别的准确率。 1、图像解码显示 利用matplot库可以方便简洁地在jupyter内对图片进行绘制与输出,首先通过tf.gfile打开图片文件,并利用函数tf.image.decode_jpeg将jpeg图片解码为三位矩阵,之后便可以
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:163kb
    • 提供者:weixin_38570145
  1. tensorflow2.x学习笔记十六:使用tf.function和Autograph提高代码性能

  2. 参考文章:https://zhuanlan.zhihu.com/p/67192636 一、基本概念        AutoGraph是TF提供的一个非常具有前景的工具, 它能够将一部分python语法的代码转译成高效的图表示代码. 由于从TF 2.0开始, TF将会默认使用动态图(eager execution), 因此利用AutoGraph, 在理想情况下, 能让我们实现用动态图写(方便, 灵活), 用静态图跑(高效, 稳定).        在TF 2.x中, 由于默认为动态图, 计算会直接
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:79kb
    • 提供者:weixin_38707826
« 12 »