大数据下载列表第1236页

[算法与数据结构] R-3.4.2-win下载

说明： R-3.4.2-win.exe包下载，支持windows x86、64版本使用。
<xulihua2017> 上传 | 大小：74mb

[kafka] kafka自学文档

说明： pdf文档，消息中间件，合适大数据，j2ee方向人群。从入门到放弃
<qq_29416831> 上传 | 大小：449kb

[算法与数据结构] 数据仓库笔记

说明：介绍了数据仓库基本概念，以及K-Means，决策树，贝叶斯等算法，和如何搭建数据仓库
<des0810> 上传 | 大小：5mb

[算法与数据结构] 中文文本相似度匹配算法 simHash 海明距离 IK分词

说明：中文文本相似度匹配算法 simHash 海明距离 IK分词完整的可运行的示例代码包含simHash 算法，使用IK 对中文文本进行分词处理
<bruce_shan> 上传 | 大小：4mb

[算法与数据结构] 使用百度Ai处理过的情感分析样本

说明：使用百度Ai处理过的情感分析样例，大概30万条数据（具体的记不清了，至少有10万条）
<qingmengshuo> 上传 | 大小：75mb

[算法与数据结构] The+Definitive+ANTLR+4+Reference 学习笔记word

说明： The+Definitive+ANTLR+4+Reference 学习笔记word The+Definitive+ANTLR+4+Reference 学习笔记word
<hjw199089> 上传 | 大小：2mb

[Hadoop] 手把手教你Hadoop环境搭建、词频统计demo及原理

说明：本文档通过网络资源收集的资料整理，具有较强的实战性，可以一步一步让你从零基础到学会搭建Hadoop服务器，并能利用FS文件系统及mapreduce做词频统计，掌握其基本原理；其中由于本人已搭建好的原因，有的图截不到，为了表述清楚，于是取自教程中的图片（黑背景部分）作为说明。本文档助你快速踏入大数据大门，祝你学业有成，加油！
<u011578317> 上传 | 大小：5mb

[Hbase] 超高性能 NoSQL 基准测试分析耐用性和性能的权衡

说明：随着公司处理越来越大的数据量和要求越来越苛刻的工作负载，新类型的数据库应运而生。此类数据库被称为“NoSQL”，它们利用传统关系型数据库使用的部分功能来换取更高的性能和/或分区容错性。但是，由于 NoSQL 解决方案自身的增殖和分化（分化为键-值存储、文档数据库、图形数据库以及“NewSQL”），针对具体某类问题尝试评估数据库状况变得越来越困难。在本文中，我们将针对一个特殊但关键的功能类来尝试回答这个问题——需要为可靠的存储引擎提供尽可能高的原始性能的应用程序
<yumingguang> 上传 | 大小：1mb