目录
-
- 数据分析的重要性及OLAP引擎的角色
- 数据分析的链路
- 大数据的历史
- 软件系统的发展
- SQL on Hadoop时代
- MPP时代
- 向量化时代
- 未来的发展方向
-
- 数据分析的语言接口
- 数据模型
- SQL
- SQL语法
- 本章小结
-
- 语法分析
- 从SQL到抽象语法树的转换过程
- 本章小结
-
- 抽象语法树和逻辑执行计划的区别
- 逻辑操作算子
- 本章小结
-
- 理论基础:代数变换定律
- 基于规则的查询优化器
- 优化器案例
- 本章小结
-
- CBO简介
- CBO通用流程
- CBO的主要使用场景
- CBO 在join重排和join类型选择中的应用
- CBO 的技术挑战
- 估算错误和应对策略
- 本章小结
-
- 7.1 启发式优化器
- 7.2 可变执行计划
- 7.3 改变并行度
- 7.4 任务负载迁移
- 7.5 算法动态切换
- 7.6 其他运行时优化
- 7.7 小结
-
- 8.1执行框架
- 8.2任务调度
- 8.3分布式算法
- 8.4 Shared-Nothing vs Shared-Disk vs Shared-Memory
- 8.5 指令集并行SIMD
[8.6任务调度和并行计算章节小结](http://mp.weixin.qq.com/s?__biz=MzI0MDI2Mzk5Mw==&mid=2247483965&idx=1&sn=0c38c9b19b5e05a7879826dc6bdd6eca&chksm=e91c346bde6bbd7de42979033deffc8da9f722a2da6e36f351f7762694394b614bc13206f19f&scene=21#wechat_redirect)
-
- 13.1 运行时代价和编译时代价
- 模板元编程基础概念
- 基于模板元编程加速计算
- 13.4 小结和参考文献
14 并行架构
- 14.1 分布式OLAP架构的驱动因素
- 14.2 并行、并发、分布式的区别
- 14.3 并行系统的评估指标
- 14.4 影响并行性能的核心因素
- 14.5 网络结构
- 14.5 网络通信设备
- 14.7 并行架构
- 14.8 分布式存储,分区和并行化
- 14.9 数据本地性 vs 计算存储分离
- 14.10 读写分离的架构
- 14.11 多租户架构
- 14.12 分布式调度和运行时监控
- 14.13 调度执行
- Presto-分布式计算架构
- 14.14 ClickHouse存储架构
- 14.14 章节小结
15 OLAP现状和未来展望