您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 集成特征选择方法在基因表达数据上的应用

  2. 基因表达数据的研究是生物医学上的一个重要课题。基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤。单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,并将此模型应用到3个不同的基因表达数据集上。为了评价特征子集的分类预测性能,使用支持向量机作为分类器进行测试。实验结果表明:相对于单一的特征选择方法,集成特征选择能够有效提高分类模型准确度。
  3. 所属分类:其它

    • 发布日期:2020-04-24
    • 文件大小:366kb
    • 提供者:weixin_38555229
  1. 机器学习领域中的基因表达数据集

  2. 里面包含现在主流的基因表达数据集,可以用于特征提取,特征选择等算法的测试数据集,里面的数据全部为mat格式且都已经标注好,直接使用就行!
  3. 所属分类:机器学习

    • 发布日期:2020-06-21
    • 文件大小:49mb
    • 提供者:weixin_41552975
  1. 一种基于互信息最大化的模型无关基因选择方法

  2. 摘要针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高。为了评价算法的性能,采用3个数据集进行了实验,结果表明 MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率。MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得
  3. 所属分类:其它