您好,欢迎光临本网站![请登录][注册会员]  
文件名称: WEKA中文详细教程.pdf
  所属分类: 数据库
  开发工具:
  文件大小: 42mb
  下载次数: 0
  上传时间: 2019-08-03
  提 供 者: byyg*****
 详细说明:本文档是Weka的中文版详细教程。Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。这是一个性价比最高的轻量级大数据分析必学软件,它和它的源代码可在其官方网站下载。IEF WEKA软件 C]Weka GUI Chooser Program Visualization Tools Help PL邑+32 WEKA「备a The University of waikato WEKA的界面 Experimenter Lilnto Environment for Inowled-e Hnalycic HnorledgeFlow viφ了,5, The univercity of hkir sim立eT HmL七冯= -land 口主要特点 它是集数据预处理、学习算法(分类、回归、聚类、关 联分析)和评估方法等为一体的综合性数据挖掘工具。 具有交互式可视化界面 提供算法学习比较环境 通过其接口,可实现自己的数据挖掘算法 3 2016/5/19 探索环境 算法试验环境 ka[的是建 解的M C二 a 黑积号k加 r HEHE Mih ef eli s Eas 部cr U面 H8C02圈 九气 wbei SEamen EmAiL副 uNrs+q1-MB→N--5-2H F eka GUI Chooser Progr am Visualization Tools Help 真1c91五s WEKA The University of waikato 知识流环境 命令行环境 linta EnTironment for Knowledge AnLlPs Kno霄1 e dsef1aY Ie 吕.b c)1999-2011 e I Talat FeMa I Batiks wtsk aufs Castanes 圈 Th+ Lniversity f hailmto Simple ClI Hmil toⅡe丌工 aland EImE F:wLE Borda 3. halp 电L1 ii FisSeL+ cHUtes 4 2016/5/19 IEF Explorer环境 盘xp1 回 Preprocess Classify[ Cluster Associate Select attributes visualize open file open URL open dAas Generate 2 Undo E Choose Apply Current relation Selected attribute Relation: hank-data Hame income 6 Type: Numeric stances boll ttributes 12 Missing: O [o%) Distinct: 599 Unique:598(100% Ttributes Statistic value Minimum 5014.21 Iert Pattern aximum 631301 Mean 27524031 Nam stdDev 128994 Ion ss: pep(Nom) visualize l income 6□ married children 5 ave al 口 current act r g bondage one Remoe Stat OK 8 「1cn xO 5 2016/5/19 IEF 把“ Explorer”界面分成8个区域 口区域1的几个选项卡是用来切换不同的挖掘任务面板。 Preprocess(数据预处理):选择和修改要处理的数据。 classify(分类):训练和测试分类或回归模型。 cluster(聚类):从数据中聚类 Associate(关联分析):从数据中学习关联规则。 Select Attributes(选择属性):选择数据中最相关的属性。 Visualize(可视化):查看数据的二维散布图。 口区域2是一些常用按钮。包括打开、编辑、保存数据及数据转换等功 能。例如我们可以把文件“bank- data. csv”另存为“bank data arff。 口区域3中可以选择(Ch。ose)某个筛选器( Filter),以实现筛选 数据或者对数据进行某种变换。数据预处理主要就利用它来实现。 6 2016/5/19 IEF 口区域4展示了数据集的关系名、属性数和实例数等基本情况。 口区域5中列出了数据集的所有属性。 勾选一些属性并“ Remove”就可以删除它们,删除后还可以利 用区域2的“Und。”按钮找回。 区域5上方的一排按钮是用来实现快速勾选的 口区域6中显示在区域5中选中的当前某个属性的摘要。 摘要包括属性名(Name)、属性类型(Type)、缺失值 ( Missing)数及比例、不同值( Distinct)数、唯一值 ( Unique)数及比例 对于数值属性和标称属性,摘要的方式是不一样的。图中显示的 是对数值属性“ Iioe”的摘要。 口数值属性显示最小值( Minimun)、最大值 ( Maximum)、均值(Mean)和标准差( Std Dev) 口标称属性显示每个不同值的计数 7 2016/5/19 IEF 口区域7是区域5中选中属性的直方图。 若数据集的最后一个属性(这是分类或回归任务的默认目标 变量)是类标变量(例如“pep”),直方图中的每个长方 形就会按照该变量的比例分成不同颜色的段。 要想换个分段的依据,在区域7上方的下拉框中选个不同的 分类属性就可以了。 下拉框里选上“ No Class”或者一个数值属性会变成黑白 的直方图。 8 2016/5/19 IEF 口区域8窗口的底部区域,包括状态栏、10g按钮和Weka鸟。 状态栏( Status)显示一些信息让你知道正在做什么。例如, 如果 Explorer正忙于装载一个文件,状态栏就会有通知。 在状态栏中的任意位置右击鼠标将会出现一个小菜单。这个菜 单给了你两个选项: 口 Memory Information-显示WEKA可用的内存量。 口 Run garbage collector--强制运行Java垃圾回收器, 搜索不再需要的内存空间并将之释放,从而可为新任务分 配更多的内存。 Log按钮可以查看以weka操作日志。 右边的weka鸟在动的话,说明WEKA正在执行挖掘任务。 9 2016/5/19 IEF Knowledge Flow环境 要 BRa noT1edge1互 ILLOM ELIT CVisusliration 日[食病「「你奩日 SCPr AI biTe Irel aat taser Asrforenee Cha rv出P= Layont 盛、一 1e匀吧的 看。° Arbr S口 Torquer Fokker S出eim PeforrenseEval-ter Ha+、tset'、cma 奩 IE=Uall citrate 尸贴t far sne ter s [KswrleleFlor 5:44 Ye 曰1 ecue tp the eka ingyledze F hr王。aler FinL shed Crosslalidati orPoldMaker Finished tYih让1白tin F“w. attribu!=5 alecto on.二f5 Finished 1.0-10.1-1.匪-12-0 10 2016/5/19
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 相关搜索: WEKA中文详细教程.pdf
 输入关键字,在本站1000多万海量源码库中尽情搜索: