您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,spark下载列表 第41页

« 1 2 ... 36 37 38 39 40 4142 43 44 45 46 ... 198 »

[spark] 决策树随堂笔记.pdf

说明: 决策树随堂笔记.pdf
<weixin_43562705> 上传 | 大小:8mb

[spark] 2.调整并行度分散同一个Task的不同Key

说明: 2.调整并行度分散同一个Task的不同Key
<weixin_43562705> 上传 | 大小:619kb

[spark] reduce端变maP端.docx

说明: reduce端变map端,
<weixin_43562705> 上传 | 大小:117kb

[spark] 测试与修改.docx

说明: 数据清洗优化,两阶段聚合数据清洗优化,
<weixin_43562705> 上传 | 大小:192kb

[spark] 第7期滴滴技术沙龙演讲资料下载版.zip

说明: 第7期滴滴技术沙龙演讲资料下载版,讲解滴滴网关架构、微博广告实时系统、瓜子im系统、滴滴出行订单平台架构演进
<toss42988> 上传 | 大小:17mb

[spark] big data 压缩包.rar

说明: 林子雨 大数据2 包含PPT及pdf扫描讲义,仅供学习,建议购买正版
<j_boom> 上传 | 大小:79mb

[spark] 大数据技术之scala.pdf

说明: 是⼀种编程范型,它将计算机运算视为数学上的函数计算,并且避免使⽤程序状态以及易变对象。 函数编程语⾔最重要的基础是λ演算(lambda calculus)。 λ演算中最关键的要素就是函数被当作变量处理,能够参与运算。 函数式编程更加强调执⾏的结果⽽⾮执⾏过程,倡导利⽤若⼲简单的执⾏单元让计算结果不断演进, 抽丝剥茧逐层推导复杂的运算,
<qq_44694681> 上传 | 大小:38mb

[spark] spark个人总结.doc

说明: 实际情况,与理想情况不同的,有些task会运行的快一点,比如50s就完了,有些task,可能会慢一点,要1分半才运行完,所以如果你的task数量,刚好设置的跟cpu core数量相同,可能还是会导致资源的浪费,因为,比如150个task,10个先运行完了,剩余140个还在运行,但是这个时候,有10个cpu core就空闲出来了,就导致了浪费。那如果task数量设置成cpu core总数的2~3倍,那么一个task运行完了以后,另一个task马上可以补上来,就尽量让cpu core不要空闲,同时
<qq_44694681> 上传 | 大小:607kb

[spark] Learn PySpark.pdf

说明: learn pyspark pdf版,文字版,带目录。。。。。。。。。
<lizikunzk> 上传 | 大小:10mb

[spark] pachong.rar

说明: 原生java爬虫Jsoup demo,里面包含有前辈的代码,鄙人借鉴了下,按照思路写了自己的demo
<sj_liu> 上传 | 大小:15kb

[spark] lxml-4.3.3-cp34-cp34m-win_amd64.rar

说明: lxml for py3.4 64位 whl 现在已经没得下了,34版的资源很少 用whl安装
<qq_33315131> 上传 | 大小:3mb

[spark] ConfigUtil.java

说明: 读取consle配置的工具类
<qq_14865711> 上传 | 大小:3kb
« 1 2 ... 36 37 38 39 40 4142 43 44 45 46 ... 198 »