数据库
数据库架构
- C/S 架构
- 传输子系统
- 查询处理器
- 查询优化器
- 执行计划与执行引擎
- 存储引擎
- 事务管理器
- 锁管理器
- 访问模式,存储结构(B 树,LSM 树)
- 缓冲管理器
- 恢复管理器
内存数据库与磁盘数据库
内存数据库
持久化(预写日志)
磁盘数据库
面向行的数据库与面向列的数据库
空间局部性
- 面向行的数据布局
- 整行存在一起
- 面向行的文件格式(CSV)
- 面向列的数据布局
- 整列存在一起
- 提高压缩率
- SIMD 优化
- 分析性工作负载
- 面向列的文件格式(Apache Parquet,Apache ORC • High-Performance Columnar Storage for Hadoop)
- 宽列存储
- BigTable
- 列族
数据文件和索引文件
存储效率,访问效率,更新效率
- 数据文件
- 索引组织表,堆组织表,哈希组织表
- 索引为念
- 主索引
- 主键
- 二级索引
- 聚簇索引
- 非聚簇索引
- 主索引
缓冲,不可变性与有序性
- 缓冲
- LSM
- 不可变性
- 有序性
B-Tree
Children
Backlinks