您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据(Mining of Massive Datasets)

  2. 英文PDF版。 《大数据:互联网大规模数据挖掘与分布式处理》由斯坦福大学的“web 挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。其中相关章节有对应的习题,以巩固所讲解的内容。
  3. 所属分类:互联网

    • 发布日期:2012-09-29
    • 文件大小:1mb
    • 提供者:wangxm1983
  1. 大数据实时计算实践:百分点架构和算法

  2. 介绍了大数据平台的基本原理,并详细说明了其中与实时计算相关部分,实时计算框架和数据查询框架的系统架构、处理流程和应用。而后,我们以海量数据计数问题为例,深入浅出的介绍了在实时计算算法中常用的方法和技巧,以及它们适用的场景和可能带来的问题。这些方法和技巧具有普遍性和通用性,被广泛应用于个性化推荐引擎的各个模块,包括用户意图预测、用户画像、个性化推荐评分、商品分类等等。如果能在实际业务中灵活运用这些方法和技巧,则能够大大提高实时计算的数据规模和处理效率,帮助业务快速发展。
  3. 所属分类:Web开发

    • 发布日期:2014-02-28
    • 文件大小:538kb
    • 提供者:u013789577
  1. 走近大数据(2014年5月)-厦门大学林子雨

  2. 1 大数据概念和应用领域 大数据的四个特点(4V),数据体量巨大、数据类型繁多、价值密度低商业价值高、处理速度快。 大数据应用领域:医疗行业、能源行业、通信行业、零售业等。 2 大数据关键技术 文件系统、数据库系统、索引和查询技术、数据分析技术、大数据处理工具等。 3 大数据在企业信息化中的应用 基于客户行为分析的产品推荐、基于数据分析的广告投放、基于客户异常行为的客户流失预测、基于环境数据的外部形势分析、基于数据分析的产品定价等等。 By 厦门大学数据库实验室 - 林子雨
  3. 所属分类:互联网

    • 发布日期:2014-05-17
    • 文件大小:2mb
    • 提供者:xmu_dblab
  1. 大数据平台及推荐的应用

  2. 大数据平台 hadoop spark storm 用户画像体系 推荐 广告
  3. 所属分类:其它

    • 发布日期:2015-09-04
    • 文件大小:1mb
    • 提供者:yangbutao
  1. 崔义超:音频大数据应用难点与经验

  2. 在第六届中国云计算大会大数据数字娱乐行业应用论坛上,车语传媒CTO崔义超认为,网络电台制胜的关键也是要做好编排。它可以通过人工编排、规则体系、实时分段、兴趣结合,以及对节目的时长、分类、标签等手段来实现。编排算法在技术上需要客服的难点包括:存储体系、算法效率、实时推荐,但效果却非常明显。
  3. 所属分类:讲义

    • 发布日期:2015-09-22
    • 文件大小:782kb
    • 提供者:villa123
  1. 大数据收割机2015.12.16.rar

  2. 大数据收割机2015.12.16, 在这个版本中,软件优化了股份动态监控、实时推荐强力股、在线网络图库等功能。
  3. 所属分类:互联网

    • 发布日期:2015-12-17
    • 文件大小:24mb
    • 提供者:lykeyou
  1. 大数据和云计算的读书笔记

  2. 主要记录了我阅读架构大数据-大数据技术及算法分析时觉得是重点的知识,涉及以下内容:大数据、云计算、Hadoop、Spark、推荐算法等 ps:请用XMind软件打开
  3. 所属分类:电子商务

    • 发布日期:2017-03-09
    • 文件大小:7mb
    • 提供者:xuqiaobo
  1. 基于用户画像的大数据实践

  2. 用户画像的实际经验、推荐系统、大数据相关的资料 用户画像的实际经验、推荐系统、大数据相关的资料
  3. 所属分类:算法与数据结构

    • 发布日期:2018-05-22
    • 文件大小:2mb
    • 提供者:yangbutao
  1. 2018中国大数据独角兽企业TOP20榜

  2. 据人民网消息,5月26日,2018中国国际大数据产业博览会在贵州拉开帷幕,让基于大数据的技术创新和商业模式创新引发新一轮舆情关注。在此背景下,人民创投、人民网舆情数据中心联合发布《中国大数据独角兽企业TOP20榜》,推荐了大数据行业中的20家优秀独角兽企业。 这是继5月19日,人民创投、人民网舆情数据中心在“2018全球独角兽企业高峰论坛”上联合发布《中国独角兽企业价值榜》和《中国瞪羚企业价值榜》后,针对独角兽企业的又一次细分推荐。 推荐的20家大数据独角兽企业业务涉及数据采集存储、分析挖掘、
  3. 所属分类:spark

    • 发布日期:2018-05-27
    • 文件大小:425kb
    • 提供者:dst1213
  1. 如何用大数据帮你找到知己? tataUFO颠覆社交玩法

  2. 在tataUFO刚刚上线的全新4.0版本中,tataUFO在大数据和云计算技术的支持下,新增了更多功能和玩法,包括全新的好友推荐、闪聊、平台内容发现等等。这是tataUFO今年最重大的一次版本升级,给用户带来全新的产品升级体验。为了更好的支持这些全新功能,tataUFO在上线前选择将整体IT架构迁移到QingCloud上。
  3. 所属分类:其它

  1. 利用大数据分析,赋能以客户为中心的业务转型.docx

  2. 利用大数据分析,赋能以客户为中心的业务转型 几年前,银行总是能通过短信、电话等渠道向你发送各种推荐信息,比如一张新的信用卡,新的房屋贷款,针对新企业新的信用额度等。显而易见,这种海量推送式的市场营销说明银行实际上对自己客户的需求和个性缺乏了解。但好消息是,这种乱七八糟的小广告似的推送信息将很快就会成为历史。今天,绝大多数的银行机构正在引入大数据分析技术,尝试利用大数据技术来帮助它们转变客户的体验。一如其他客户主导的其他产业,银行也在通过预判客户的行为和需求来努力争取客户。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-03-01
    • 文件大小:23kb
    • 提供者:u013998480
  1. 八斗大数据-第九期.docx

  2. 1.包含MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。 2.包含FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术。 3.包含NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等。 特点: 1.完整版,有实践 2.链接有效 3.有预习的录播课程
  3. 所属分类:Hadoop

    • 发布日期:2020-01-10
    • 文件大小:12kb
    • 提供者:u014299058
  1. 大数据.pdf

  2. 大数据理论知识讲解,及Hadoop的配置,4V属性讲解,Nosql2、搭建 Hadoop集群环境 21安装DK 见附件:《DK环境搭建.md》 22搭建z0 keeper集群 见附件:《乙K环境搭建.md》 23搭建 hadoop集群 见巛 hadoop集群搭建md》 六、 Hadoop-HDFS 1、简介 Hadoop Distributed File Systen Hadoop的分布式文件系统,是GFs( Google File System)的克隆 分布式 分别部署,将一个系统划分为多个子
  3. 所属分类:Hadoop

    • 发布日期:2019-08-17
    • 文件大小:698kb
    • 提供者:longhhao
  1. 尚硅谷大数据之Scala语言核心编程.pdf

  2. 尚硅谷大数据scala语言核心编程,是大数据开发必备的技能。心残谷 尚硅谷语言课程 变量的基本使用 决速入门 变量使用说明 变量声明基本语法 注意事项 程序中号的使用 数据类型 数据类型体系一览图(记住) 数据类型列表 整数类型 基本介绍 整型的类型 整型的使用细节 浮点类型 基木介绍 浮点型的分类 浮点数的使用细节 字符类型 基本介绍 案例演示: 字符类型使用细节 布尔类型 基本介绍 类型、 类型和 类型 堪本说明 使用细节的案例 值类型转换 值类型隐式转换 值类型隐式转换 高级隐式转换和隐式
  3. 所属分类:其它

  1. MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程

  2. 大数据量备份与还原,始终是个难点。当MYSQL超10G,用mysqldump来导出就比较慢了。在这里推荐xtrabackup,这个工具比mysqldump要快很多。 一、Xtrabackup介绍 1、Xtrabackup是什么 Xtrabackup是一个对InnoDB做数据备份的工具,支持在线热备份(备份时不影响数据读写),是商业备份工具InnoDB Hotbackup的一个很好的替代品。 Xtrabackup有两个主要的工具:xtrabackup、innobackupex 1、xtraback
  3. 所属分类:其它

    • 发布日期:2020-12-15
    • 文件大小:90kb
    • 提供者:weixin_38698149
  1. python使用pandas处理大数据节省内存技巧(推荐)

  2. 一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。 当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。 本文我们讨论pandas的内存使用,展示怎样
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:860kb
    • 提供者:weixin_38655682
  1. 大牛书单 | 大数据存储方向好书分享

  2. 导语:读书是一生的功课,技术人通过读书实现自我提升,学习优秀知识沉淀。TEG书知道本期特邀腾讯云数仓数据湖产品负责人堵俊平、腾讯云数据库负责人林晓斌、腾讯TEG云架构平台部数据块中心高级工程师王银虎,腾讯TEG计费平台部账户中心专家工程师潘安群为大家带来大数据方向好书推荐。来看看技术大牛在读什么,收藏优质内容,愿本期书单助您更专业。 堵俊平,腾讯云数仓数据湖产品负责人, T4专家工程师,腾讯开源联盟(TOSA)现任*,Apache开源基金会Member, Apache Hadoop项目Co
  3. 所属分类:其它

  1. 【推荐】智慧国电、智慧电力(物联网、大数据、云计算)方案.pptx

  2. 智慧国电、智慧电力(物联网、大数据、云计算)方案,2021智慧电力解决方案智能化巡检在线监控信息化平台系统建设
  3. 所属分类:电子政务

    • 发布日期:2021-03-14
    • 文件大小:20mb
    • 提供者:qq_35004943
  1. 漫谈ELK在大数据运维中的应用

  2. 圈子里关于大数据、云计算相关文章和讨论是越来越多,愈演愈烈。行业内企业也争前恐后,群雄逐鹿。而在大数据时代的运维挑站问题也就日渐突出,任重而道远了。本文旨在针对复杂的大数据运维系统推荐一把利器,达到抛砖引玉的效果,如果文中出现任何纰漏和错误的地方,恳请指正,欢迎讨论,希望大家不吝赐教。众所周知,大数据平台组件是很复杂的。笔者之前接触的一个大数据平台解决方案,仅平台组件就达20多个,这还没有加上物联网系统各组件。而这庞大的系统整合问题,对于运维来说是很头疼的。所以,在大数据时代下的运维问题是日渐尖
  3. 所属分类:其它

  1. 漫谈ELK在大数据运维中的应用

  2. 圈子里关于大数据、云计算相关文章和讨论是越来越多,愈演愈烈。行业内企业也争前恐后,群雄逐鹿。而在大数据时代的运维挑站问题也就日渐突出,任重而道远了。本文旨在针对复杂的大数据运维系统推荐一把利器,达到抛砖引玉的效果,如果文中出现任何纰漏和错误的地方,恳请指正,欢迎讨论,希望大家不吝赐教。众所周知,大数据平台组件是很复杂的。笔者之前接触的一个大数据平台解决方案,仅平台组件就达20多个,这还没有加上物联网系统各组件。而这庞大的系统整合问题,对于运维来说是很头疼的。所以,在大数据时代下的运维问题是日渐尖
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »