阿帕奇火花
Apache Spark是一个开源的分布式集群计算框架。 它在内存上比Hadoop MapReduce快100倍,在磁盘上快10倍。 它可以在Java,Scala,R,Python和SQL Shell上运行。 它具有许多库的堆栈,例如Spark Streaming,SQL和数据框架,以及用于机器学习的Mlib和用于图形处理的GraphX。 以及可以在应用程序中无缝使用的许多其他应用程序。 Apache Spark可以在具有JVM和Apache Spark框架的计算机上作为独立集群运行