您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3mb
    • 提供者:vcfriend
  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:847kb
    • 提供者:qiu1440528444
  1. 机器学习算法基础学习总结

  2. 机器学习算法基础学习总结2.基本算法 2.1 Logistic回归 优点:计算代价不高,易于理解和实现。 缺点:容易欠拟合,分类精度可能不高 适用数据类型:数值型和标称型数据。 类别:分类算法。 试用场景:解决二分类问题。 简述: Logistic回归算法基于 Sigmoid函数,或者说 Sigmoid就是逻辑回归函数。 Sigmoid函数定义如下:1/(1-exp(-z))。函数值域范围(0,1)。可以用来做分 类器。 Sigmoid函数的函数曲线如下: 逻辑凹归模型分解如下:(1)首先将不同
  3. 所属分类:机器学习

    • 发布日期:2019-07-02
    • 文件大小:305kb
    • 提供者:abacaba
  1. 用python实现k近邻算法的示例代码

  2. K近邻算法(或简称kNN)是易于理解和实现的算法,而且是你解决问题的强大工具。 什么是kNN kNN算法的模型就是整个训练数据集。当需要对一个未知数据实例进行预测时,kNN算法会在训练数据集中搜寻k个最相似实例。对k个最相似实例的属性进行归纳,将其作为对未知实例的预测。 相似性度量依赖于数据类型。对于实数,可以使用欧式距离来计算。其他类型的数据,如分类数据或二进制数据,可以用汉明距离。 对于回归问题,会返回k个最相似实例属性的平均值。对于分类问题,会返回k个最相似实例属性出现最多的属性。 k
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:61kb
    • 提供者:weixin_38695159
  1. python使用knn实现特征向量分类

  2. 这是一个使用knn把特征向量进行分类的demo。 Knn算法的思想简单说就是:看输入的sample点周围的k个点都属于哪个类,哪个类的点最多,就把sample归为哪个类。也就是说,训练集是一些已经被手动打好标签的数据,knn会根据你打好的标签来挖掘同类对象的相似点,从而推算sample的标签。 Knn算法的准确度受k影响较大,可能需要写个循环试一下选出针对不同数据集的最优的k。 至于如何拿到特征向量,可以参考之前的博文。 代码: #-*- coding: utf-8 -*- __author_
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:52kb
    • 提供者:weixin_38624746
  1. 如何实现一个KNN算法

  2. 教你如何自己实现KNN算法 KNN算法,也称为K邻近算法,可以解决回归和分类问题,但解决分类问题才是它的优势。 KNN算法的本质就是寻找与我们提供的数据相似的k个样本,然后判断这k个样本的标签,最后统计每个标签出现的次数,次数最多的标签,就会被当作我们提供的数据的标签。 先说说工作流程: 机器学习是基于数据的,所以要先将实物转换为向量、矩阵或张量的形式 通过欧式距离计算出测试样本与其他样本之间的距离 将距离按照小到大排序,并取前K个值 判断前K个值相应的标签,并进行统计 统计最多的标签即为预测结
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:53kb
    • 提供者:weixin_38611254
  1. Machine-Learning-w-MNIST:使用MNIST数据集的机器学习模型-源码

  2. 使用MNIST数据集的机器学习模型 KNN是一种简单,易于实现的有监督的机器学习算法,可用于解决分类和回归问题。 但是请记住,KNN的主要缺点是随着数据量的增加,它会变得非常慢,这使得它在需要快速做出预测的环境中是不切实际的选择。 这是一本笔记本,展示了如何训练ML模型以及如何使用KNN算法识别手写数字。 默认参数来自sklearn,经过测试k =2。这是一个正在进行的工作,请随时进行改进。 我将再添加两个模型,即SVM和Random Forest,以查看是否有可能进行改进(很可能是这种情况
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:12mb
    • 提供者:weixin_42149153