今天了解了一下Spark,Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark 最大的特点就是快,可比 Hadoop MapReduce 的处理速度快 100 倍,还有Spack的生态体系,
1、Python编程语言; 2、Scala编程语言; 3、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算;
并且下载安装了Spark