Summary Introduction SparkSQL介绍 SparkSQL的发展历程 SparkSQL的性能 SparkSQL的使用 SqlContext的使用 HiveContext的使用 SparkSQL的三种使用方式 常用操作 Cache Table 外部数据源 SparkSQL调优 SparkSQL的运行过程 SqlContext的运行过程 HiveContext的运行过程 Catalyst优化器 Catalyst介绍 TreeNode Rule Analyzer Optimizer 总结 SparkSQL组件解析 SqlParser Physical Plan UDF In-Memory Columnar Storage External Data Source Code Generation 推荐资料