您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3mb
    • 提供者:vcfriend
  1. 演示内容:文档的向量化.py

  2. # -*- coding: utf-8 -*- """ 演示内容:文档的向量化 """ from sklearn.feature_extraction.text import CountVectorizer corpus = [ 'Jobs was the chairman of Apple Inc., and he was very famous', 'I like to use apple computer', 'And I also like to eat apple'
  3. 所属分类:机器学习

    • 发布日期:2020-03-18
    • 文件大小:1kb
    • 提供者:aotomo740
  1. feature_extraction.py

  2. # -*- coding: utf-8 -*- import numpy as np import librosa import random def extract_power(y, sr, size=3): """ extract log mel spectrogram feature :param y: the input signal (audio time series) :param sr: sample rate of 'y' :par
  3. 所属分类:深度学习

    • 发布日期:2020-05-27
    • 文件大小:3kb
    • 提供者:qq_39594369
  1. CountVectorizer参数学习

  2. 指定vocabulary,此时tokenizer/token_pattern/stop_words/max_df等都无效,即和分词有关的参数都无效。可以看到最终生成的词典只有我们参数中指定的a/他/喜欢   为什么会这样呢?我们去研究一下源代码(sklearn/feature_extraction/text.py):   其中CountVectorizer中的fit_transform的源代码如下所示,需要重点关注的是 self._validate_vocabulary()和self.count
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:510kb
    • 提供者:weixin_38515270
  1. Bible_verse_predictor:圣经经文预言家-源码

  2. Bible_verse_predictor 创建了我的工作环境并安装了必要的库 创建模型,将其另存为泡菜文件,以便于重复使用 创建一个Web界面(使用html和CSS),可以在其中输入经文,并在其中可以将旧约或新约的预测与旧约和新约的情感和概率得分区分开 以下是使用腌制模型的应用(app.py)本身的说明(用于评估的朴素贝叶斯,在这种情况下为原始文本) A)从flask中,我们导入Flask,render_template,request和url_for,还将pandas导入为pd,将num
  3. 所属分类:其它