Python 与 Spark How-tos

这些操作指南将向您展示如何使用 PySpark 模块在 Spark 集群上运行 Python 任务。这些操作指南还将向您展示如何与存储在集群上 HDFS 中的数据进行交互。

虽然这些操作方法不相互依赖并且可以按任何顺序完成,但建议您首先从Spark、YARN 和 HDFS 概述开始。