13、可观测性(一):如何监控一个复杂的分布式系统你好,我是陈现麟。 通过学习“雪崩”系列的内容,我们掌握了构建一个稳定的分布式系统所需的四大方法:熔断、限流、降级和扩容,再也不用担心由于一个局部的小问题,导致整个系统出现重大的故障了。 在“雪崩”系列课程中,我们曾经提到需要基于系统内部的运行状态,...2026-03-01深入浅出分布式技术原理
14、可观测性(二):如何设计一个高效的告警系统你好,我是陈现麟。 通过上节课的学习,我们掌握了在可观测性体系中,监控的位置和重要性,以及设计一个监控系统的基本原则,这样我们就可以为极客时间搭建一个可观测体系,并且设计一个简洁有效的监控系统了。 但是,只有监控还是不够的,因为我们不能一直盯着监控系...2026-03-01深入浅出分布式技术原理
15、故障(一):预案管理竟然能让被动故障自动恢复你好,我是陈现麟。 通过学习“监控”与“告警”这两节课的内容,你已经学会如何利用 Metric、Trace 和 Log 搭建一个可观测系统,去监控极客时间这样的分布式系统。并且知道了在系统出现故障时,职责明确的告警机制,可以在第一时间通知到相关的工程...2026-03-01深入浅出分布式技术原理
16、故障(二):变更管理,解决主动故障的高效思维方式你好,我是陈现麟。 通过上一节课的学习,你已经理解了系统故障的评估标准,并且明白了在 SLA 一定的情况下,平均故障恢复的时间越短,对用户体验的影响就越小,所以快速恢复故障是一个非常关键的目标。接着,我们采用分治法,将故障分为被动故障和主动故障,讨论...2026-03-01深入浅出分布式技术原理
17、分片(一):如何选择最适合的水平分片方式你好,我是陈现麟。 结束了“分布式计算篇”的系列学习,我们掌握了如何解决分布式系统中,无状态节点或服务之间内部的协调问题,利用这些知识和技术原理,你就可以轻松地构建、运维一个大规模无状态的分布式系统了,恭喜你,取得了一个值得庆祝的学习成果。 接下来我...2026-03-01深入浅出分布式技术原理
18、分片(二):垂直分片和混合分片的 trade、off你好,我是陈现麟。 通过了解水平分片策略中,关于数据划分和数据平衡的原理和知识,我们可以基于极客时间的业务场景,选择合适的数据划分和数据平衡的方式,组合出最佳的水平分片策略。 而在一些数据分析的场景中,一行数据往往有非常多的字段,我们在计算时,却只需...2026-03-01深入浅出分布式技术原理