您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第1007页

« 1 2 ... .02 .03 .04 .05 .06 1007.08 .09 .10 .11 .12 ... 1438 »

[算法与数据结构] 面向工业大数据的多层增量特征提取方法

说明: 针对工业大数据中高维小样本情况导致增量线性判别分析失效问题,提出了一种面向工业大数据的多层增量特征提取方法,对高维小样本数据进行有效降维,并最大限度保留样本的变异信息和判别信息。首先,利用滑动窗口增量实时更新数据流,检测和过滤离群点,基于增量主成分分析对数据进行初步特征提取,利用Fisher准则函数量化各主元所包含的分类信息;然后,采用熵值法确定各主元贡献率和识别能力的权重,对主元进行筛选,由筛选出的主元构成新的特征空间;最后,将当前窗口的高维数据通过增量线性判别分析投影,完成二次特征提取的同
<qq_28339273> 在 上传 | 大小:515072

[算法与数据结构] 面向分布式数据流大数据分类的多变量决策树

说明: 分布式数据流大数据中的类别边界不规则且易变,因此基于单变量决策树的集成分类器需要较大数量的基分类器才能准确地近似表达类别边界,这将降低集成分类器的学习与分类性能.因而,本文提出了基于几何轮廓相似度的多变量决策树.在最优基准向量的引导下将n维空间样本点投影到一维空间以建立有序投影点集合,然后通过类别投影边界将有序投影点集合划分为多个子集,接着分别对不同类别集合的交集递归投影分裂,最终生成决策树.实验表明:本文提出的多变量决策树GODT具有很高的分类精度和较低的训练时间,有效结合了单变量决策树学习
<qq_28339273> 在 上传 | 大小:1048576

[Hbase] 基于Hbase的多分类逻辑回归算法研究

说明: 为解决在大数据环境下,用于训练多分类逻辑回归模型的数据集可能会超过执行计算的客户端内存的问题,提出了块批量梯度下降算法,用于计算回归模型的系数。将训练数据集存入HBase后,通过设置表扫描对象的起始行键参数,可取出大小合适的含训练样本及结果值的数据块,同时为避免客户端到服务端频繁的RPC调用,取出的数据块可进行多次迭代计算,以加快系数的收敛。当取出的数据块达到指定的迭代次数后,再按行键次序取出下一个数据块,如此循环,直到系数收敛或达到指定的循环控制阈值。多分类的逻辑回归问题可转换为二分类来解决
<qq_28339273> 在 上传 | 大小:1048576

[算法与数据结构] 基于大数据的视频智能分析系统的应用

说明: 大数据技术在营销、金融等行业用来分析客户行为指导精准营销,已经取得了广泛成功。但是在视频监控领域应用发展十分迟缓,其主要原因就是视频监控领域的核心数据是视频是非结构化数据,无法直接使用成熟的大数据软件进行分析处理。对此,首先对大数据技术进行了介绍,并对大数据技术在视频智能分析领域应用进行详细探究,以期促进视频大数据在平安城市建设的应用。
<qq_28339273> 在 上传 | 大小:1004544

[算法与数据结构] 面向位置大数据的快速密度聚类算法

说明: 本文面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域的核心点和密度相连关系;其次,给出了网格簇定义,将基于位置点的密度簇映射成基于网格的密度簇,利用排他网格与相邻网格的密度关系,可快速确定网格簇的包含网格;第三,利用基于Cell的距离分析理论和网格簇概念,实现了一个快速密度聚类算法,将DBSCAN基于数据点
<qq_28339273> 在 上传 | 大小:4194304

[算法与数据结构] 大数据与统计新思维

说明: 最近,《大数据时代》等几本书引起了广泛的关注,大数据正在改变着人们的行为与思维,那么以数据为研究对象的统计学该如何应对,本文基于对大数据的理解,认为统计思维需要发生三个方面的改变,即要改变认识数据的思维、收集数据的思维和分析数据的思维。其中,数据分析思维又要在统计分析过程、实证分析思路、推断分析逻辑等方面发生变化,同时统计分析评价的标准也要有所调整。围绕这些变化,本文提出需要从八个方面去积极应对大数据,以促使统计学科跟上时代的步伐。
<qq_28339273> 在 上传 | 大小:308224

[算法与数据结构] 位置大数据的价值提取与协同挖掘方法

说明: 随着位置服务和车联网应用的不断普及,由地理数据、车辆轨迹和应用记录等所构成的位置大数据已成为当前用来感知人类社群活动规律、分析地理国情和构建智慧城市的重要战略性资源,是大数据科学研究极其重要的一部分.与传统小样统计不同,大规模位置数据存在明显的混杂性、复杂性和稀疏性,需要对其进行价值提取和协同挖掘,才能获得更为准确的移动行为模式和区域局部特征,从而还原和生成满足关联应用分析的整体数据模型.因此,着重从以下3个方面系统综述了针对位置大数据的分析方法,包括:(1)针对数据混杂性,如何先从局部提取出
<qq_28339273> 在 上传 | 大小:1048576

[算法与数据结构] 大数据时代下数据分析理念的辨析

说明: 本文在剖析了国内外大数据研究和应用现状的基础上,提出了"大数据时代"的定义,并从统计学的角度界定了"大数据"概念。同时,根据大数据的特点,本文重新审视了在大数据时代统计研究工作过程及统计思维所面临的挑战,明确了统计工作和统计研究转变的基本思路。
<qq_28339273> 在 上传 | 大小:342016

[算法与数据结构] 遥感大数据自动分析与数据挖掘

说明: 成像方式的多样化以及遥感数据获取能力的增强,导致遥感数据的多元化和海量化,这意味着遥感大数据时代已经来临。然而,现有的遥感影像分析和海量数据处理技术难以满足当前遥感大数据应用的要求。发展适用于遥感大数据的自动分析和信息挖掘理论与技术,是目前国际遥感科学技术的前沿领域之一。本文围绕遥感大数据自动分析和数据挖掘等关键问题,深入调查和分析了国内外的研究现状和进展,指出了在遥感大数据自动分析和数据挖掘的科学难题和未来发展方向。
<qq_28339273> 在 上传 | 大小:448512

[算法与数据结构] 位置大数据隐私保护研究综述

说明: 大数据时代移动通信和传感设备等位置感知技术的发展形成了位置大数据,为人们的生活、商业运作方法以及科学研究带来了巨大收益.由于位置大数据用途多样,内容交叉冗余,经典的基于"知情与同意"以及匿名的隐私保护方法不能全面地保护用户隐私.位置大数据的隐私保护技术度量用户的位置隐私,在信息论意义上保护用户的敏感信息.介绍了位置大数据的概念以及位置大数据的隐私威胁,总结了针对位置大数据隐私的统一的基于度量的攻击模型,对目前位置大数据隐私保护领域已有的研究成果进行了归纳.根据位置隐私的保护程度,可以把现有方法
<qq_28339273> 在 上传 | 大小:1048576

[spark] spark-2.1.1-bin-hadoop2.7

说明: spark-2.1.1-bin-hadoop2.7;spark-2.1.1-bin-hadoop2.7;spark-2.1.1-bin-hadoop2.7;
<mobiusstrip> 在 上传 | 大小:200278016

[算法与数据结构] 大数据可视分析综述

说明: 可视分析是大数据分析的重要方法.大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧.主要从可视分析领域所强调的认知、可视化、人机交互的综合视角出发,分析了支持大数据可视分析的基础理论,包括支持分析过程的认知理论、信息可视化理论、人机交互与用户界面理论.在此基础上,讨论了面向大数据主流应用的信息可视化技术——面向文本、网络(图)、时空、
<qq_28339273> 在 上传 | 大小:3145728
« 1 2 ... .02 .03 .04 .05 .06 1007.08 .09 .10 .11 .12 ... 1438 »