您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于数据挖掘的客户流失预测实证研究

  2. 本文研究的客户流失数据集具有典型的非平衡数据问题,客户流失对象为网 络招聘行业的企业客户。全球网络招聘方兴未艾,据统计全球每天约有2000 万 条就业信息发布,3000 多万人在互联网上发出求职简历,2006 年全球招聘市场 规模为172 亿美元。在中国,2007 年网络招聘市场规模为9.7 亿元,2008 年12.5 亿,预计2009 年将达到16.1 亿元。网络招聘巨大的市场规模,良好的利润前景 催生了新的专业化、行业性、地方性的招聘网站的诞生,同时也加剧了网络招聘 行业的激烈竞争。
  3. 所属分类:互联网

    • 发布日期:2011-07-25
    • 文件大小:1mb
    • 提供者:sxfmol
  1. 非平衡类数据分类

  2. 数据挖掘的分类问题,主要是关于非平衡数据的分类问题
  3. 所属分类:其它

    • 发布日期:2013-03-08
    • 文件大小:508kb
    • 提供者:shenzhexuan8888
  1. 基于混合采样的非平衡数据集分类研究_古平_欧阳源遊

  2. 基于混合采样的非平衡数据集分类研究_古平_欧阳源遊
  3. 所属分类:讲义

    • 发布日期:2014-11-14
    • 文件大小:457kb
    • 提供者:zidane0627
  1. 非平衡数据特征问题的研究与非平衡分类问题算法综述.

  2. 数据集合的非平衡性指不同类型的样本量的大小较为悬殊。近年来,肖衡 数据分类问题的重要性已经引起了广泛关注。然而,对于高维非平衡数据分类特 征选择技术的研究并不多见。本文在回顾了非平衡数据已有方法的同时,介绍了 两种新的应对方法,分别是基于类型分解的特征选择方法,以及基于Hellinger 距离的特征选择方法。
  3. 所属分类:专业指导

    • 发布日期:2015-02-09
    • 文件大小:10mb
    • 提供者:nneerr123
  1. 基于半监督过采样非平衡学习的矿山微震信号识别

  2. 为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类器进行模式识别。通过在兖矿集团微震数据集进行试验,结果表明:针对微震数据的半监督过采样框架可以有效提高微震数据的识别准确率。与只进行过采样的方法相比,使用CPLE和SELF两种半监督学习的方法,在KNN、LR、FLD、RF、SVM和Adaboost这6个分类器上有5个分类器
  3. 所属分类:其它

  1. 基于MapReduce的非平衡大数据集分类

  2. 非平衡大数据集分类是近年来机器学习领域的研究热点。因为许多实际应用领域中都存在非平衡大数据,如医疗诊断数据、信用卡欺诈检测数据、网络入侵检测数据等集。所以研究非平衡大数据集分类具有重要的理论意义和实际应用价值。针对两类非平衡大数据集分类,本文提出了正类样例交叉上采样与分类器集成相结合的方法。具体地,在上采样阶段,正类样例的上采样按下面两步交叉进行:第一步,利用Map Reduce计算正类样例的类中心,并在中心与每一个正类样例点的连线上进行采样;第二步,对新采样的正类样例中的每一个样例点,用Map
  3. 所属分类:算法与数据结构

    • 发布日期:2020-01-15
    • 文件大小:2mb
    • 提供者:sunearlier
  1. 基于流形嵌入过采样的非平衡数据分类方法

  2. 工业监测数据中正常与异常状态数据一般存在非平衡性,而传统的过采样非平衡数据处理方法往往在解决非线性、高维含噪的非平衡问题时不能获得满意的模式分类效果.本文利用流形学习的非线性降维,提出一种流形嵌入过采样方法,为有机结合流形学习与过采样的非平衡数据模式分类方法提供了统一框架.研究结果表明:该方法采用过采样平衡数据在流形空间的低维嵌入数据直接完成模式分类,可以减小流形嵌入空间到原始数据空间反映射的计算代价和模式分类成本.另外,流形学习可以有效保持原始数据结构特性,在流形嵌入空间的过采样可以实现更符合
  3. 所属分类:其它

    • 发布日期:2020-06-03
    • 文件大小:626kb
    • 提供者:weixin_38507208
  1. 分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料

  2. 分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料,全套学习资料,分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料,全套学习资料。
  3. 所属分类:C/C++

    • 发布日期:2020-06-01
    • 文件大小:17mb
    • 提供者:qq_43689832
  1. 通信与网络中的分析样本大小对非平衡数据分类的影响

  2. 本文对非平衡类数据分类问题进行了概述。首先在简单介绍非平衡类数据基本概念的基础上,分析了非平衡类数据引起的问题及其导致分类性能下降的原因;然后介绍了目前主要的解决方法,分析了现有处理方法的优缺点;最后讨论了未来的研究方向   普通分类问题中,各个类包含的数据分布比较平衡,稀有类分类问题中,数据的分布极不平衡。例如:将一批医疗数据分类为“癌症患者”和“非癌症患者”两个类,其中 “癌症患者”是小比例样本(假设占总样本的1%),称其为目标类,“非癌症患者”为多数类样本,称为非目标类,从大量数据中正确识
  3. 所属分类:其它

    • 发布日期:2020-10-22
    • 文件大小:180kb
    • 提供者:weixin_38743481
  1. 基于混合重采样的非平衡数据SVM训练方法

  2. 针对传统的SVM算法在非平衡数据分类中分类效果不理想的问题,提出一种基于分类超平面和SMOTE过采样方法(HB_SMOTE)。该方法首先对原始训练样本集使用WSVM算法找到分类超平面,然后按一定标准剔除负类中被错分的样本、靠近分类超平面的样本以及远离分类超平面的样本。在UCI数据集上的实验结果表明:与RU_SMOTE等重采样方法相比,HB_SMOTE方法对正类样本和负类样本都具有较高的分类准确率。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:393kb
    • 提供者:weixin_38623919
  1. 样本大小对非平衡数据分类的影响

  2. 探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素——样本大小对稀有类的影响进行了研究。
  3. 所属分类:其它

    • 发布日期:2020-10-24
    • 文件大小:187kb
    • 提供者:weixin_38748740
  1. 一种用于非平衡数据分类的集成学习模型

  2. 针对非平衡数据分类问题,提出了一种改进的SVM-KNN分类算法,在此基础上设计了一种集成学习模型。该模型采用限数采样方法对多数类样本进行分割,将分割后的多数类子簇与少数类样本重新组合,利用改进的SVM-KNN分别训练,得到多个基本分类器,对各个基本分类器进行组合。采用该模型对UCI数据集进行实验,结果显示该模型对于非平衡数据分类有较好的效果。
  3. 所属分类:其它

  1. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法

  2. 非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(Synthetic Minority Over-Sampling Technique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合成新样本,由此产生过拟合瓶颈.为更好地解决该问题,提出了一种基于单边选择链和样本分布密度的非平衡数据挖掘新方法(One-Sided Link&Distribution Density-SMOTE,OSLDD-SMOTE).OS
  3. 所属分类:其它

  1. 基于NKSMOTE算法的非平衡数据集分类方法

  2. 基于NKSMOTE算法的非平衡数据集分类方法
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:429kb
    • 提供者:weixin_38631042
  1. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法

  2. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法
  3. 所属分类:其它

  1. 一种基于核SMOTE的非平衡数据集分类方法

  2. 本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:531kb
    • 提供者:weixin_38742656
  1. 一种用于非平衡数据的SVM学习算法

  2. 在实际应用中的分类数据往往是非平衡数据,少数类别的数据可能有很大的分类代价。分类性能不仅要考虑分类精度,同时要考虑分类代价。该文扩展了支持向量机(SVM)学习方法,对于以高斯核为核函数时的少数类和多数类使用不同的惩罚参数C+,C-以获得高敏感度的超平面,并提出利用遗传算法对SVM的学习参数进行优化调整。给出一种新的评价函数,对分类结果的质量进行评价。实验结果证明,算法对于非平衡数据的分类有较好的效果,对少数类样本预测的准确性较高。
  3. 所属分类:其它

  1. 基于非RAW数据的数码反射显微镜色度特征化

  2. 为了防止彩色数码反射显微镜的白平衡算法失效,提高图像颜色采集精度,提出了基于非RAW数据的数码相机色度特征化方法。首先,利用色卡中性色块建立基于幂函数的非线性校正模型,将非RAW数据转换为与场景辐亮度线性相关的数据。然后,建立色度特征化模型。最后,通过实验测试非RAW数据校正前后的色度特征化精度,并分析光源亮度变化对非线性校正模型及色度特征化精度的影响。结果表明,校正后的非RAW数据将提高色度特征化精度,对于线性色度特征化模型效果尤为明显。同时,光源亮度改变将引起非线性校正模型以及色度特征化精度
  3. 所属分类:其它

  1. 分析样本大小对非平衡数据分类的影响

  2. 本文对非平衡类数据分类问题进行了概述。首先在简单介绍非平衡类数据基本概念的基础上,分析了非平衡类数据引起的问题及其导致分类性能下降的原因;然后介绍了目前主要的解决方法,分析了现有处理方法的优缺点;讨论了未来的研究方向   普通分类问题中,各个类包含的数据分布比较平衡,稀有类分类问题中,数据的分布极不平衡。例如:将一批医疗数据分类为“癌症患者”和“非癌症患者”两个类,其中 “癌症患者”是小比例样本(假设占总样本的1%),称其为目标类,“非癌症患者”为多数类样本,称为非目标类,从大量数据中正确识别“
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:174kb
    • 提供者:weixin_38536841
  1. 一种基于GMM-EM的非平衡数据的概率增强算法

  2. 非平衡数据的分类问题是机器学习领域的一个重要研究课题.在一个非平衡数据里,少数类的训练样本明显少于多数类,导致分类结果往往偏向多数类.针对非平衡数据分类问题,提出一种基于高斯混合模型-均值最大化方法(GMM-EM)的概率增强算法.首先,通过高斯混合模型(GMM)与均值最大化算法(EM)建立少数类数据的概率密度函数;其次,根据高概率密度的样本生成新样本的能力比低概率密度的样本更强的性质,建立一种基于少数类样本密度函数的过采样算法,该算法保证少数类数据集在平衡前后的概率分布的一致性,从数据集的统计性
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:320kb
    • 提供者:weixin_38712279
« 12 3 4 5 6 7 8 9 10 ... 14 »