您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,算法与数据结构下载列表 第302页

« 1 2 ... .97 .98 .99 .00 .01 302.03 .04 .05 .06 .07 ... 530 »

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第12章 文本挖掘

说明: 本章介绍文本分类。由于大部分交流信息以文本格式保存,文本分类是文本挖掘中的一个重要主题。我们将建立一个RapidMiner挖掘流程,来学习垃圾短信和我们实际想阅读的短信之间的区别。然后我们将应用此学习到的模型到新的短信中,来确定其是否为垃圾短信。垃圾短信是许多熟悉主题中的一种,自然地,我们由此就开始动手工作。用于垃圾短信分类的相同的技术可以在许多其他文本挖掘领域中使用。
<qq_40370890> 上传 | 大小:301kb

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第11章 决策树与神经网络

说明: 决策树方法在分类、预测、规则提取等领域有着广泛应用。在20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinilan提出了ID3[5-2]算法以后,决策树在机器学习、数据挖掘邻域得到极大的发展。Quinilan后来又提出了C4.5,成为新的监督学习算法。1984年几位统计学家提出了CART分类算法。ID3和ART算法大约同时被提出,但都是采用类似的方法从训练样本中学习决策树。
<qq_40370890> 上传 | 大小:1mb

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第9章 K-Means 聚类、辨别分析

说明: 与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度将他们划分为若干组,划分的原则是组内样本最小化而组间(外部)距离最大化,如图9 1所示。
<qq_40370890> 上传 | 大小:362kb

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第8章 关联分析与关联规则

说明: 关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。 8.1.1 常用关联规则算法 常用关联算法如所表8 1所示。
<qq_40370890> 上传 | 大小:655kb

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第7章 数据预处理

说明: 在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 数据预处理的主要内容包括数据清洗,数据集成,数据变换和数据规约。处理过程
<qq_40370890> 上传 | 大小:1mb

[算法与数据结构] 《RapidMiner数据分析与挖掘实战》第4章 数据和结果可视化

说明: 前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一章会详细阐述结果视图。依据您是否已经生成了可被描述的结果,在默认设置前提下,您现在应该至少能大致看到这些显示内容,如图4.1所示。
<qq_40370890> 上传 | 大小:1mb

[算法与数据结构] 《Rapidminer数据分析与挖掘实战(中文版)》第2章 RapidMiner简介 Word版

说明: 第2章 RapidMiner Studio简介 RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。
<qq_40370890> 上传 | 大小:3mb

[算法与数据结构] 基于并行计算的文本分类技术

说明: 针对传统文本分类方法对于海量数据分类速度慢精度差等问题,将并行计算应用到文本分类领域,设计了一套基于MapReduce的并行化文本分类框架,结合Bagging算法思想提出了支持向量机的并行训练方法,并在Hadoop云计算平台上进行了实验,实验结果表明该分类方法具有较快的分类速度和较高的分类精度。
<qq_28339273> 上传 | 大小:364kb

[算法与数据结构] 用excel学数据挖掘

说明: 近几年来,作为一种非常强大的分析数据的方法,数据挖掘的应用范围在不断扩大,但实际上这种卓越的分析方法只局限于少数的企业和专业人士在使用。普通人在面对昂贵的专业软件和一系列令人费解的统计学术语、复杂公式的时候,很多就放弃了。其实,我们忽视了身边既便宜又方便而且强大的数据挖掘工具——Excel。本书运用大量实例介绍了Excel的强大工具,通俗易懂,让你轻松掌握用Excel进行数据挖掘的方法。 目录
<best989> 上传 | 大小:22mb

[算法与数据结构] 我国心血管专科临床科研数据中心的建设与思考

说明: 我国心血管专科临床科研数据中心的建设与思考,内容丰富详实。
<jiqirenwali1> 上传 | 大小:825kb

[算法与数据结构] 海量数据相似度计算

说明: 针对海量的文本资源,可以有效的进行快速计算。满足动态计算需求
<aoe_12345> 上传 | 大小:3kb

[算法与数据结构] 社会网络分析-python

说明: 社会网络分析 动物书, 基于python语言的分析 7章180页
<rjx_1996> 上传 | 大小:43mb
« 1 2 ... .97 .98 .99 .00 .01 302.03 .04 .05 .06 .07 ... 530 »