本書(shū)是關(guān)于大數據和Spark的一個(gè)簡(jiǎn)明手冊。它將助你學(xué)習如何用Spark來(lái)完成很多大數據分析任務(wù),其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進(jìn)行交互式數據分析、如何編寫(xiě)Spark應用、如何在Spark中對大規模數據進(jìn)行交互分析、如何使用SparkStreaming處理高速數據流、如何使用Spark進(jìn)行機器學(xué)習、如何使用Spark進(jìn)行圖處理、如何使用集群管理員部署Spark、如何監控Spark應用等。本書(shū)還對其他配合Spark一起使用的大數據技術(shù)進(jìn)行了介紹,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本書(shū)也對機器學(xué)習和圖的概念進(jìn)行了介紹。