1、列式存储已经取代行式存储了吗

你好,我是彭旭。 从这节课开始,我们要积累一部分数据库的基础知识。今天我们主要聚焦在列式存储和行式存储的区别上,再给你介绍一个被多个数据库引擎支持的、最流行的列式数据存储格式。 在大数据时代,列式存储出现的频率很高,讨论列式存储优势的文章汗牛充栋,这...

分布式数据库从入门到实战

2、分布式存储数据结构LSM,如何优化读写性能

你好,我是彭旭。 当前数据库都使用硬盘来持久化存储数据。市面上的硬盘主要分为SSD固态硬盘和HHD机械硬盘。其中,SSD固态硬盘读写性能高,但是价格贵,传统关系型数据库用得比较多。 大数据、分布式存储由于数据量大,使用SSD硬盘会导致存储成本过高。所...

分布式数据库从入门到实战

3、编码和压缩有什么用

你好,我是彭旭。 今天我们课程的内容是编码与压缩。在设计一个优秀的数据库时,存储空间、性能以及资源占用无疑是必须深入考虑的关键因素。这些因素直接关联到数据库的效率、成本以及用户的体验。这里面,编码与压缩也是至关重要的一环。 通过这节课的学习,你一定能...

分布式数据库从入门到实战

4、数据库都需要事务和MVCC吗

你好,我是彭旭。 想要保证数据操作的一致性、隔离性和持久性,提高数据库系统的并发性和可靠性,事务与MVCC(Multi-Version Concurrency Control,多版本并发控制)是一个绕不开的话题。 MVCC是一种数据库事务并发控制的方...

分布式数据库从入门到实战

5、分布式数据库如何合理分区与设计行键

你好,我是彭旭。 上一讲我们介绍了事务和MVCC,说到分布式数据库(比如HBase)对事务的支持较弱,甚至StarRocks、ClickHouse是不支持传统事务的。这是因为分布式数据库涉及多个服务器,跨表跨行事务需要协调集群多个节点,复杂性大大提高...

分布式数据库从入门到实战

6、数据分区后,如何应对Join

你好,我是彭旭。 上一讲,我们介绍了在分布式数据库中合理地分库分表或者分区的方法,还讲了如何裁剪查询时需要扫描的数据,优化查询性能。 但是,分区也会带来一个新的问题。数据表之间通常存在关联关系,一个完整的业务通常需要关联多个表,才能得到最终需要的业务...

分布式数据库从入门到实战
1235