History

fantasticbin 7f19ee9c59 课程提交		2022-09-03 22:05:03 +08:00
..
docs	课程提交	2022-09-03 22:05:03 +08:00
book.json	课程提交	2022-09-03 22:05:03 +08:00
README.md	课程提交	2022-09-03 22:05:03 +08:00
SUMMARY.md	课程提交	2022-09-03 22:05:03 +08:00

README.md

SRE实战手册

你将获得

理解 SRE 的正确姿势
10+ SRE 必学必会知识点
可落地的故障应急处理机制
2 种典型 SRE 组织架构案例分享

讲师介绍

赵成，蘑菇街技术总监，《赵成的运维体系管理课》作者，运营公众号“成哥的世界”。他还是ArchSummit全球架构师峰会运维专题明星讲师和优秀出品人，TGO杭州分会会员。赵成曾在华为工作七年，有丰富的电信行业软件研发及运维经验。

近两年，赵成和他的团队花了大量精力来做稳定性保障方面的事情，不断探索在SRE方面的实践，并取得了巨大成效。2019年，在SRE领域最具国际影响力的SRECon上，他分享了蘑菇街在容量压测方面的实践经验，得到了全球各大公司同行们的热烈反馈。

在国内，他还发起了颇具影响力的“聊聊SRE”社区，为广大SRE爱好者提供了一个深度交流的平台。

课程介绍

SRE（Site Reliability Engineering），网站稳定性工程，最早是由Google设置的一类工程师岗位，专职负责其超大规模分布式产品（如搜索、Gmail、Docs等）的稳定性。而后，SRE慢慢发展成了一系列面向稳定性的，包括技术、管理、流程、组织架构，以及文化建设的最佳实践，并最终被提炼成一套方法论，广泛流传。

在国内，SRE的这套方法论，也被很多企业的IT团队作为技术能力提升和组织转型，特别是运维转型的参考标准。但是，在实际落地这套方法论时，大家有很多疑惑，比如：

SRE如果不是运维的升级版，那它到底是什么？
SRE涉及范围如此之大，到底应该从哪里入手建设呢？
在稳定性方面，有些公司已经做了很多工作，特别是在技术体系搭建上，为什么还是故障频发？难道单纯的技术保障还不够吗？
引入了SRE，团队的能力应该怎么提升？组织架构应该怎么匹配呢？

因此，我们邀请赵成老师开设了《SRE实战手册》这个课程。他将结合自己的实践经验，从基础理论和实践操作两方面入手，一次性解决你心中的困惑，帮助你正确认识SRE，掌握可落地的实践方法。

这个课程分为基础篇和实践篇两大模块。

基础篇：带你从实践的角度理解SRE是什么，并以SRE的基本概念SLO和SLI作为切入点，教你一步步建立起SRE稳定性标准。最后结合具体的电商案例，分享在实际场景中设定稳定性目标应该考虑的因素。
实践篇：围绕“故障”这个影响稳定性的核心事件，分享故障发现、故障处理、故障复盘三个阶段的最佳实践。同时，着眼落地SRE时绕不开的组织架构问题，分享真实的组织架构设置实践和高效的跨团队协作经验。

课程目录

适合人群

有1年以上运维和开发经验的工程师，运维领域架构师，业务架构师，技术团队负责人。

不管你是否正在落地SRE，只要你关注系统、业务或应用等的稳定性问题，这个课程都适合你学习。

特别放送

免费领取福利

限时活动推荐

订阅须知

订阅成功后，推荐通过“极客时间”App端、Web端学习。
本专栏为虚拟商品，交付形式为图文+音频，一经订阅，概不退款。
订阅后分享海报，每邀一位好友订阅有现金返现。
戳此先充值再购课更划算，还有最新课表、超值赠品福利。
企业采购推荐使用“极客时间企业版”便捷安排员工学习计划，掌握团队学习仪表盘。
戳此申请学生认证，订阅课程享受原价5折优惠。
价格说明：划线价、订阅价为商品或服务的参考价，并非原价，该价格仅供参考。未划线价格为商品或服务的实时标价，具体成交价格根据商品或服务参加优惠活动，或使用优惠券、礼券、赠币等不同情形发生变化，最终实际成交价格以订单结算页价格为准。

README.md Unescape Escape