同步更新于知乎:https://zhuanlan.zhihu.com/p/107889958
最近在做整理,偶尔看到公众号的一篇关于随机抽样的分享,这个算法面试中经常会问到,特此总结一下。
网上关于这块解释并不清晰,主要参考如下,个人感觉写的比他更通俗易懂,哈哈。
https://zhuanlan.zhihu.com/p/107793995
解决什么问题
主要用于解决大数据流中的随机抽样问题,即:当内存有限,数据长度很大,甚至未知,那么如何从中随机选取k个数据,并且要求是等概率
算法核心
水塘抽