搜索资源 - feature_extraction.py - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - feature_extraction.py

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档
文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档简介文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟，SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果，前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中，仍然有很多问题没有很好的解决，比如文本分类中的高维性和稀疏性、类别的不平衡
所属分类：Python
- 发布日期：2014-02-23
- 文件大小：3mb
- 提供者：vcfriend

演示内容：文档的向量化.py
# -*- coding: utf-8 -*- """ 演示内容：文档的向量化 """ from sklearn.feature_extraction.text import CountVectorizer corpus = [ 'Jobs was the chairman of Apple Inc., and he was very famous', 'I like to use apple computer', 'And I also like to eat apple'
所属分类：机器学习
- 发布日期：2020-03-18
- 文件大小：1kb
- 提供者：aotomo740

feature_extraction.py
# -*- coding: utf-8 -*- import numpy as np import librosa import random def extract_power(y, sr, size=3): """ extract log mel spectrogram feature :param y: the input signal (audio time series) :param sr: sample rate of 'y' :par
所属分类：深度学习
- 发布日期：2020-05-27
- 文件大小：3kb
- 提供者：qq_39594369

CountVectorizer参数学习
指定vocabulary，此时tokenizer/token_pattern/stop_words/max_df等都无效，即和分词有关的参数都无效。可以看到最终生成的词典只有我们参数中指定的a/他/喜欢为什么会这样呢？我们去研究一下源代码(sklearn/feature_extraction/text.py)：其中CountVectorizer中的fit_transform的源代码如下所示，需要重点关注的是 self._validate_vocabulary()和self.count
所属分类：其它
- 发布日期：2021-01-21
- 文件大小：510kb
- 提供者：weixin_38515270

Bible_verse_predictor:圣经经文预言家-源码
Bible_verse_predictor 创建了我的工作环境并安装了必要的库创建模型，将其另存为泡菜文件，以便于重复使用创建一个Web界面（使用html和CSS），可以在其中输入经文，并在其中可以将旧约或新约的预测与旧约和新约的情感和概率得分区分开以下是使用腌制模型的应用（app.py）本身的说明（用于评估的朴素贝叶斯，在这种情况下为原始文本） A）从flask中，我们导入Flask，render_template，request和url_for，还将pandas导入为pd，将num
所属分类：其它
- 发布日期：2021-03-30
- 文件大小：3mb
- 提供者：weixin_42126677