34、降级熔断:如何屏蔽非核心系统故障的影响?你好,我是唐扬。 到目前为止,你的电商系统已经搭建了完善的服务端和客户端监控系统,并且完成了全链路压测。现在呢,你们已经发现和解决了垂直电商系统中很多的性能问题和隐患。但是千算万算,还是出现了纰漏。 本来,你们对于应对“双十一”的考验信心满满,但因为...2025-11-06
33、配置管理:成千上万的配置项要如何管理?你好,我是唐扬。 相信在实际工作中,提及性能优化你会想到代码优化,但是实际上有些性能优化可能只需要调整一些配置参数就可以搞定了。为什么这么说呢?我给你举几个例子: 你可以调整配置的超时时间让请求快速失败,防止系统的雪崩,提升系统的可用性; 你还可以...2025-11-06
32、压力测试:怎样设计全链路压力测试平台?你好,我是唐扬。 经过两节课的学习,我们已经搭建了服务端和客户端的监控,通过监控的报表和一些报警规则的设置,你可以实时地跟踪和解决垂直电商系统中出现的问题了。不过,你不能掉以轻心,因为监控只能发现目前系统中已经存在的问题,对于未来可能发生的性能问题是...2025-11-06
31、应用性能管理:用户的使用体验应该如何监控?你好,我是唐扬。 上一节课中,我带你了解了服务端监控搭建的过程。有了监控报表之后,你的团队在维护垂直电商系统时,就可以更早地发现问题,也有直观的工具辅助你们分析排查问题了。 不过你很快发现,有一些问题,服务端的监控报表无法排查,甚至无法感知。比如,有...2025-11-06
30、给系统加上眼睛:服务端监控要怎么做?你好,我是唐扬。 在一个项目的生命周期里,运行维护占据着很大的比重,在重要性上,它几乎与项目研发并驾齐驱。而在系统运维过程中,能够及时地发现问题并解决问题,是每一个团队的本职工作。所以,你的垂直电商系统在搭建之初,运维团队肯定完成了对于机器CPU、内...2025-11-06