您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. topk:前K-源码

  2. topk:前K
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:76kb
    • 提供者:weixin_42131424
  1. CS130A-research-topK:链表实现的top-K空间节省算法-源码

  2. Tom Zu-search-topK-节省空间 链表实现的Top-K空间节省算法 2021/3 / 4-2021 / 3/5期间完成的工作 论文“数据流中频繁和Top-k元素的有效计算”中提出的算法 链接: : 运行程序 将所有数据放入名称为fname的.txt文件中,每行一个数据。 数据格式无关紧要,它们都作为字符串处理。 文件名fname和数字K作为命令行参数传递。 在终端: $ make all $ ./topK.out fanem K 输出包括 按节省空间算法对前K个最频繁的
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:48kb
    • 提供者:weixin_42099987
  1. 日常算法实践-源码

  2. 日常算法实践 02-06-2021:给定100G的URL磁盘数据,使用最多1G内存,统计出现频率最高的前K个URL 新建约100个文件,利用哈希(URL)%100的值,将每条URL映射到对应文件下,保证同一URL本质全部映射到同一文件下。 预先分布比较均匀,则每个文件大小大约1G,可在内存中操作,在内存中简单地统计词频即可。 对每个文件都取出相应的topK的K个根据count降序排列,形成类似一个数组,将100个文件的写入同一个文件。 对100个K对进行。得到K个即可*甚至100个K对
  3. 所属分类:其它