稳定性之于系统,就像健康之于人类,看起来重要不紧急,然而一旦失去,就追悔莫及。
稳定性是一切 0 前面的 1。
- 让无法解决的问题少一点点,让世界的确定性多一点点。
- 打造国内稳定性领域知识库,降低知识获取门槛。
- GitHub 地址
- 在线文档站(阅读体验更佳)
- 钉钉群号
- 30000312(2群,推荐)
- 23179349(1群,已满)
- 如果你在本专栏有所收获,欢迎分享给身边的朋友,期待更多同学的加入!
- 2022-10-24
- 2022-07-14
- 2022-04-15
- 2021-11-17
- 2021-11-08
- 2021-09-23
- 2021-08-27
- 2021-05-27
- 2019-12-26
- 2019-11-07
- 2019-09-19
- 2019-09-05
- 2019-08-22
- So Hot?快给 CPU 降降温@涯海
- 虾米SRE实践:监控体系升级之路@全琮
- 混沌工程介绍与实践@穹谷
- 如何检测Web服务请求丢失问题@竹影
- 2019-08-08
- 2019-07-26
- 目标用户:稳定性相关的从业人员、技术决策者、爱好者等。
- 参与形式:欢迎一切有想法或兴趣的同学一起共建,可以自由选择参与内容编写、渠道宣传、社区维护等活动。
- 写作原则:通俗易懂,让读者有所收获,尽量避免介绍公网无法获取的内部产品或工具。
- 内容格式:Markdown & PDF 格式,易于传播、分享与共建。
- 内容管理:文档即代码,通过 Git 管理;代码目录与内容框架目录保持一致。会定期 Review 代码/目录结构。
- 内容编写:建议内容原创或再创作。为了保障文章质量,不建议直接转载。
- 问题列表:所有人有任何问题和建议都可以通过 Issue 的形式提交。
- 目录拆分尽量遵循 MCME 原则(互相独立,完全穷尽)。
- 每个专题尽量保证 3 篇及以上的优质文章。
- 内容目录一定要与代码目录保持结构一致。
- 文档类型
- 原创,注明作者与创作时间。
- 转载,取得原作者许可,注明出处,注意许可协议风险。
- 一句话标题,提纲挈领地表达要解决的问题。
- 标题应该表达的是问题的核心线索,而不是深层次原因。因为用户排查问题时只能看到表象。比如 SQL 慢是表象,没有创建索引是原因。
- 可以在标题后的第一段做一些补充,对该问题做一个概括性描述,整体结构按照总-分-总模式。
- 问题的现象是什么?
- 问题产生的原因是什么?
- 如果有前置的背景知识,可以科普一下,让读者更容易理解。
- 怎么去排查,会用到哪些工具?
- 详细介绍排查思路与路径,最好是小白式操作,事无巨细,能够完美复现。
- 在本模块可以介绍一些开源或云产品的使用,不要涉及内部产品,另外产品介绍不要带有太明显的主观偏向性。
- 解决后的效果如何?
- 前后效果对比。
- 简要的问题复盘总结,文档收尾。
- 推荐阅读/产品链接/公众号/交流群等。