30、给系统加上眼睛:服务端监控要怎么做?你好,我是唐扬。 在一个项目的生命周期里,运行维护占据着很大的比重,在重要性上,它几乎与项目研发并驾齐驱。而在系统运维过程中,能够及时地发现问题并解决问题,是每一个团队的本职工作。所以,你的垂直电商系统在搭建之初,运维团队肯定完成了对于机器CPU、内...2025-11-06高并发系统设计40问
31、应用性能管理:用户的使用体验应该如何监控?你好,我是唐扬。 上一节课中,我带你了解了服务端监控搭建的过程。有了监控报表之后,你的团队在维护垂直电商系统时,就可以更早地发现问题,也有直观的工具辅助你们分析排查问题了。 不过你很快发现,有一些问题,服务端的监控报表无法排查,甚至无法感知。比如,有...2025-11-06高并发系统设计40问
32、压力测试:怎样设计全链路压力测试平台?你好,我是唐扬。 经过两节课的学习,我们已经搭建了服务端和客户端的监控,通过监控的报表和一些报警规则的设置,你可以实时地跟踪和解决垂直电商系统中出现的问题了。不过,你不能掉以轻心,因为监控只能发现目前系统中已经存在的问题,对于未来可能发生的性能问题是...2025-11-06高并发系统设计40问
33、配置管理:成千上万的配置项要如何管理?你好,我是唐扬。 相信在实际工作中,提及性能优化你会想到代码优化,但是实际上有些性能优化可能只需要调整一些配置参数就可以搞定了。为什么这么说呢?我给你举几个例子: 你可以调整配置的超时时间让请求快速失败,防止系统的雪崩,提升系统的可用性; 你还可以...2025-11-06高并发系统设计40问
34、降级熔断:如何屏蔽非核心系统故障的影响?你好,我是唐扬。 到目前为止,你的电商系统已经搭建了完善的服务端和客户端监控系统,并且完成了全链路压测。现在呢,你们已经发现和解决了垂直电商系统中很多的性能问题和隐患。但是千算万算,还是出现了纰漏。 本来,你们对于应对“双十一”的考验信心满满,但因为...2025-11-06高并发系统设计40问
35、流量控制:高并发系统中我们如何操纵流量?你好,我是唐扬。 上一节课里,我带你了解了微服务架构中常见的两种有损的服务保护策略:熔断和降级。它们都是通过暂时关闭某些非核心服务或者组件从而保护核心系统的可用性。但是,并不是所有的场景下都可以使用熔断降级的策略,比如,电商系统在双十一、618大促的...2025-11-06高并发系统设计40问
37、计数系统设计(一):面对海量数据的计数器要如何做?你好,我是唐扬。 从今天开始,我们正式进入最后的实战篇。在之前的课程中,我分别从数据库、缓存、消息队列和分布式服务化的角度,带你了解了面对高并发的时候要如何保证系统的高性能、高可用和高可扩展。课程中虽然有大量的例子辅助你理解理论知识,但是没有一个完整...2025-11-06高并发系统设计40问
38、计数系统设计(二):50万QPS下如何设计未读数系统?你好,我是唐扬。 在上一节课中我带你了解了如何设计一套支撑高并发访问和存储大数据量的通用计数系统,我们通过缓存技术、消息队列技术以及对于Redis的深度改造,就能够支撑万亿级计数数据存储以及每秒百万级别读取请求了。然而有一类特殊的计数并不能完全使用我...2025-11-06高并发系统设计40问
39、信息流设计(一):通用信息流系统的推模式要如何做?你好,我是唐扬。 前两节课中,我带你探究了如何设计和实现互联网系统中一个常见模块——计数系统。它的业务逻辑其实非常简单,基本上最多只有三个接口,获取计数、增加计数和重置计数。所以我们在考虑方案的时候考察点也相对较少,基本上使用缓存就可以实现一个兼顾性...2025-11-06高并发系统设计40问