您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Web-Harvest学习笔记.doc

  2. Web-Harvest是Web数据挖掘工具。提供一种方法收集目标网页和挖掘有用的数据。为此,使用XSLT,XQUERY,Regular Exp等技术。 其网址在http://web-harvest.sourceforge.net/。 挖掘数据也称为WebScraping或WebDataMining。每个挖掘过程是用户自定义的,通过执行基于xml的配置文件。 例如: WebHarverst提供一组数据处理和控制流。Processor组合成管道,构成执行链。也提供了variable co
  3. 所属分类:Web开发

    • 发布日期:2009-06-11
    • 文件大小:99kb
    • 提供者:smbmaths
  1. Java并发编程学习笔记

  2. Java并发编程学习笔记 人们一直认为并发编程技术是 Java 编程中的高级技术,没有必要掌握。由 编程中的高级技术,没有必要掌握。由 于一些技术框架提供了较好的多线程支持(比如 于一些技术框架提供了较好的多线程支持(比如 Servlet 、RMI ), 很多时候软件 很多时候软件 工程师 可以不必过多考虑 可以不必过多考虑 可以不必过多考虑 可以不必过多考虑 多线程 问题。然而,如果你是一个大型数据分析 问题。然而,如果你是一个大型数据分析 问题。然而,如果你是一个大型数据分析 问题。然而,
  3. 所属分类:Java

    • 发布日期:2013-04-12
    • 文件大小:4mb
    • 提供者:mydozero
  1. 数据挖掘与R学习笔记

  2. 经典教程数据挖掘与R语言自学笔记,正在学习中,后续会添加内容
  3. 所属分类:数据库

    • 发布日期:2015-08-06
    • 文件大小:134kb
    • 提供者:smiliy777
  1. scikit-learn学习笔记.rar

  2. scikit-learn中文学习笔记,很详细的笔记,一起分享。
  3. 所属分类:Python

    • 发布日期:2015-11-11
    • 文件大小:70kb
    • 提供者:newflw_lt
  1. 中山大学数据挖掘与机器学习课件

  2. 中山大学数据科学与计算机学院《数据挖掘与机器学习》课程课件个人整理版(附带些许笔记),深入浅出,适用于机器学习入门的同学
  3. 所属分类:讲义

    • 发布日期:2018-07-11
    • 文件大小:29mb
    • 提供者:linxp6
  1. 机器学习个人笔记完整版--博士学霸的学习笔记

  2. 一个博士生的机器学习、数据挖掘的笔记,强烈推荐,跟着学霸一起学就是高效!
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-27
    • 文件大小:11mb
    • 提供者:cyh_rosefer
  1. 数据挖掘十大算法详解.zip

  2. 数据挖掘十大算法详解,数据挖掘学习笔记--决策树C4.5 、数据挖掘十大算法--K-均值聚类算法 、机器学习与数据挖掘-支持向量机(SVM)、拉格朗日对偶、支持向量机(SVM)(三)-- 最优间隔分类器 (optimal margin classifier) 、支持向量机(SVM)(五)-- SMO算法详解、PageRank等
  3. 所属分类:算法与数据结构

    • 发布日期:2019-06-28
    • 文件大小:3mb
    • 提供者:inverse_fang
  1. AndrewNG机器学习笔记v5.4—黄海广.pdf

  2. 本笔记是针对斯坦福大学 2014 年机器学习课程视频做的个人笔记。本课程提供了一个广泛的介绍机器学习、数据挖掘、统计模式识别的课程。主题包括: (一)监督学习(参数/非参数算法,支持向量机,核函数,神经网络)。 (二)无监督学习(聚类,降维,推荐系统,深入学习推荐)。 (三)在机器学习的最佳实践(偏差/方差理论;在机器学习和人工智能创新过程)。
  3. 所属分类:机器学习

    • 发布日期:2020-01-26
    • 文件大小:8mb
    • 提供者:Leytton
  1. 数据挖掘和大数据处理经验笔记

  2. 1.学习数据挖掘的整体流程及相关的数据库编程技能 2.理解数据清洗,数据整合,数据建模的概念 3. 学习处理海量数据包括如何建表,如何快速查询,插入数据。
  3. 所属分类:Oracle

    • 发布日期:2020-09-30
    • 文件大小:52kb
    • 提供者:qq_22201881
  1. 二手车交易价格预测学习笔记 — Task4

  2. 赛题:零基础入门数据挖掘 – 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX 建模与调参 常用方法 pandas 减少内存用量 df.memory_usage() 将数值型列类型细分,str列转换为category类型 截距 intercept 权重 coef 排序 sorted() 指定排序的列 key
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:43kb
    • 提供者:weixin_38734993
  1. 二手车交易价格预测学习笔记 — Task3

  2. 赛题:零基础入门数据挖掘 – 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX 特征工程 常用方法 from operator import itemgetter 获取某位置的数据 pandas 提取行数据 pd.iloc() 或 pd.loc() 分位数 quantile() pandas 一维数组 pd
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:61kb
    • 提供者:weixin_38721252
  1. 二手车交易价格预测学习笔记 — Task5

  2. 赛题:零基础入门数据挖掘 – 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX 模型融合 常用方法 from sklearn.datasets import make_blobs #聚类数据生成 from sklearn import datasets #提供数据集 from sklearn.tree im
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:48kb
    • 提供者:weixin_38663837
  1. 零基础数据挖掘入门系列(五) – 模型建立与调参

  2. 思维导图:零基础入门数据挖掘的学习路径 1. 写在前面 零基础入门数据挖掘是记录自己在Datawhale举办的数据挖掘专题学习中的所学和所想, 该系列笔记使用理论结合实践的方式,整理数据挖掘相关知识,提升在实际场景中的数据分析、数据清洗,特征工程、建模调参和模型融合等技能。所以这个系列笔记共五篇重点内容, 也分别从上面五方面进行整理学习, 既是希望能对知识从实战的角度串联回忆,加强动手能力的锻炼,也希望这五篇笔记能够帮助到更多喜欢数据挖掘的小伙伴,我们一起学习,一起交流吧。 既然是理论结合实践的
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:227kb
    • 提供者:weixin_38640242
  1. 数据挖掘学习笔记

  2. 数据挖掘学习笔记 现有一组facebook数据,x1-x10为已知属性,y为要预测的变量,首先导包,和数据。 import numpy as np import pandas as pd from statsmodels.formula.api import ols import statsmodels.api as sm ## 导入数据 train_facebook = pd.read_csv(r"E:\wechart\train_facebook.csv") ## 完整数据 p_face
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:63kb
    • 提供者:weixin_38659374
  1. 数据挖掘学习笔记(四)

  2. 第二章 数据 数据预处理是数据挖掘过程的第一个主要步骤,了解数据才能为分析与挖掘做好预处理。 数据的属性: 数据值类型 数据的分布 图形表示形式 数据的相似性与相异性 数据的属性 1.数据对象 数据集由数据对象组成。 一个数据对象代表一个实体。 例如: 销售数据库:顾客、商品、销售 医疗数据库:患者、医生、诊断治疗 大学生数据库:学生、教授、课程 数据对象又称为样本、实例、数据点、对象或元组。 数据对象用属性描述。 数据表的行对应数据对象,列对应属性。 2.属性(Attributes) 属性:
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:57kb
    • 提供者:weixin_38516706
  1. 【数据分析与挖掘重要笔记1】

  2. 文章目录要学习的内容数据分析之路什么是数据数据能做什么朴素的数据观皇帝的新装Python行业状况Boss直聘身边高薪的人继续web之路动态数据 要学习的内容 pandas比较重要 数据分析之路 什么是数据 对于当今社会来说,凡是 能电子化记录的,都是数据。 例如:摩拜把自行车数据化 了, 阿里把人和商品都数据化 了, 车联网把车也数据花了, 甚至很多的生物公司把基因和 病毒 都数据化了。可能现在一 些数据没有技术能处理他们, 但是- 有技术变革,那数据的 能量是巨大的。 数据能做什么 数据是
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:766kb
    • 提供者:weixin_38618094
  1. 数据挖掘学习笔记(三)

  2. 数据分析与数据挖掘的方法 1.频繁模式 频繁模式:数据中频繁出现的模式。 频繁项集:频繁在事务数据集中一起出现的商品集合。 例如,信用卡分析、患者就诊分析、购物车分析… 2.分类与回归 分类与标签预测是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标识未知的对象的类标号。 分类预测类别(离散的、无序的)标号,回归建立连续值函数模型,也就是用来预测缺失的或难以获得的数值数据值。 典型方法:决策树、朴素贝叶斯分类、支持向量机、神经网络、规则分类器、基于模式的分类、逻辑回归… 3.聚类
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:64kb
    • 提供者:weixin_38618819
  1. 数据挖掘小白的自存笔记 -图表应用场景

  2. 数据挖掘小白的自存笔记 本笔记目的 在做学习EDA的时候发现大神用各种各样的图,于是就很懵逼什么情况下该用什么样的图,花了4个小时浏览了几十个网页,去掉了重复和比较水的网页.保留下几个. 成果 链接1描述了5种数据关系,和图类型速览 [对信息中包含的5种关系,可以简单归纳如下:] 构成:占总体的百分比 -表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,这时候可以用到饼图 比较:项目的排名 -比较可以展示事物的排列顺序——是“大于”、“小于”或者“大致相当”都是比较相对关系中的关
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:135kb
    • 提供者:weixin_38655309
  1. Python学习笔记——大数据之Spark简介与环境搭建

  2. Spark是Apache顶级项目里面最火的大数据处理的计算引擎,它目前是负责大数据计算的工作。包括离线计算或交互式查询、数据挖掘算法、流式计算以及图计算等。核心组件如下:SparkCore:包含Spark的基本功能;尤其是定义RDD的API、操作以及这两者上的动作。其他Spark的库都是构建在RDD和SparkCore之上的。SparkSQL:提供通过ApacheHive的SQL变体Hive查询语言(HiveQL)与Spark进行交互的API。每个数据库表被当做一个RDD,SparkSQL查询被
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:557kb
    • 提供者:weixin_38643401
  1. 数据挖掘学习笔记(一)

  2. 概述 数据分析与数据挖掘 1.数据分析 采用适当的统计分析方法对收集到的数据进行分析、概括和总结,对数据进行恰当的描述,提取有用的信息的过程。 数据分析一般具有比较明确的目标,可以根据数据分析的结果得出适当的判断,用来为以后的决策提供依据。 早在20世纪初期,数据分析的基础就已经确立。 数据分析的结果有表格,图(排列图、因果图、散布图、直方图、控制图)等表示方法。 2.数据挖掘(Data Mining,DM) 从海量的数据中通过相关的算法来发现隐藏在数据中的规律和知识的过程。 在大量的、未经过加
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:49kb
    • 提供者:weixin_38628552
« 12 3 4 »