13、客户数据平台(CDP)的存储与计算需求

你好,我是彭旭。 从这一讲开始,我们就进入StarRocks相关内容。在这个章节,我会从一个客户数据平台CDP的需求出发,和你一起看看在StarRocks中,如何选用合适的表类型来设计CDP的数据模型,如何更好地分区分桶,在海量数据中生成SQL标签?...

分布式数据库从入门到实战

14、技术上,StarRocks如何应对CDP需求

你好,我是彭旭。 上一讲我们分析了CDP的业务场景,CDP从各个渠道收集用户业务数据、行为数据后,根据规则为用户生成标签画像。显然收集、清洗后的数据越多,就能产生更多的标签,对用户的画像也就越丰满。所以这节课,我们先来看一下StarRocks在技术架...

分布式数据库从入门到实战

15、数据存储上如何选用合适的表存储类型

你好,我是彭旭。 上节课我们探索了StarRocks的架构和数据分布,也介绍了CDP的几个表,了解了如何在StarRocks里面设计分区分桶键。 这节课我们再来看看,CDP的数据模型,在StarRocks里面,该如何选用合适的存储引擎。 从数仓的建模...

分布式数据库从入门到实战

16、性能上如何优化数据查询

你好,我是彭旭。 上一讲我们在StarRocks里选择了适合CDP的存储模型。这一讲我们来看看CDP的几个场景,在StarRocks下,能否优化、如何优化。 CDP在StarRocks下的性能测试为了让你对StarRocks性能有一个更直观的感受,我...

分布式数据库从入门到实战

17、ClickHouse为什么会给人极致速度的印象

你好,我是彭旭。 从这一讲开始,我们就进入到ClickHouse相关内容。在ClickHouse篇,我们会先深入探讨ClickHouse的架构设计和表模型,随后,再结合CDP(客户数据平台)的实际需求,分析ClickHouse的性能表现,并探讨优化策...

分布式数据库从入门到实战

18、ClickHouse应该如何选用表引擎

你好,我是彭旭。 我们在上节课讲ClickHouse的极致性能的时候,提到了ClickHouse支持灵活多样的表引擎,而每个表引擎都有自己的适用场景。 表引擎决定了数据表最终数据存储的模式,能够支撑的数据量大小,数据读写的方式等等。如果选择了不恰当的...

分布式数据库从入门到实战