大数据下载,spark下载列表第41页

[spark] 决策树随堂笔记.pdf

说明：决策树随堂笔记.pdf
<weixin_43562705> 上传 | 大小：8mb

[spark] 2.调整并行度分散同一个Task的不同Key

说明： 2.调整并行度分散同一个Task的不同Key
<weixin_43562705> 上传 | 大小：619kb

[spark] reduce端变maP端.docx

说明： reduce端变map端，
<weixin_43562705> 上传 | 大小：117kb

[spark] 测试与修改.docx

说明：数据清洗优化，两阶段聚合数据清洗优化，
<weixin_43562705> 上传 | 大小：192kb

[spark] 第7期滴滴技术沙龙演讲资料下载版.zip

说明：第7期滴滴技术沙龙演讲资料下载版，讲解滴滴网关架构、微博广告实时系统、瓜子im系统、滴滴出行订单平台架构演进
<toss42988> 上传 | 大小：17mb

[spark] big data 压缩包.rar

说明：林子雨大数据2 包含PPT及pdf扫描讲义，仅供学习，建议购买正版
<j_boom> 上传 | 大小：79mb

[spark] 大数据技术之scala.pdf

说明：是⼀种编程范型，它将计算机运算视为数学上的函数计算，并且避免使⽤程序状态以及易变对象。函数编程语⾔最重要的基础是λ演算（lambda calculus）。 λ演算中最关键的要素就是函数被当作变量处理，能够参与运算。函数式编程更加强调执⾏的结果⽽⾮执⾏过程，倡导利⽤若⼲简单的执⾏单元让计算结果不断演进，抽丝剥茧逐层推导复杂的运算，
<qq_44694681> 上传 | 大小：38mb

说明：实际情况，与理想情况不同的，有些task会运行的快一点，比如50s就完了，有些task，可能会慢一点，要1分半才运行完，所以如果你的task数量，刚好设置的跟cpu core数量相同，可能还是会导致资源的浪费，因为，比如150个task，10个先运行完了，剩余140个还在运行，但是这个时候，有10个cpu core就空闲出来了，就导致了浪费。那如果task数量设置成cpu core总数的2~3倍，那么一个task运行完了以后，另一个task马上可以补上来，就尽量让cpu core不要空闲，同时
<qq_44694681> 上传 | 大小：607kb