您的位置：首页 >新闻 >

为不可避免的事情做准备: 技术失败时要遵循的5个步骤

来源：时间：2021-10-24 15:54:58

亚马逊在3月末的大规模互联网中断提醒人们，任何提供公共云服务的公司，无论大小，都需要事件响应计划。停电是生活中的事实; 重要的是当它们发生时你如何应对。

拥有适当的流程是必不可少的，但是这些流程不能 (也不应该尝试) 涵盖所有可能发生的情况。如果上午3点发生意外，您的事件响应团队需要坚定的指导方针，以帮助他们决定在随后的关键时刻如何采取行动。

在Atlassian，我们提出了五个价值观，指导我们如何应对事件并最大程度地减少干扰。关于 “价值” 的文章很多，但它们不仅仅是挂在墙上的好东西。我们的工程师期待这些价值观来引导他们在压力下做出艰难的决定。

每个值映射到事件响应的特定组件。我在这里分享它们，希望它们对您的组织也有用。

检测

值: Atlassian知道我们的客户之前

精心设计的服务将具有足够的监视功能，以在任何问题成为事件之前检测并标记任何问题。如果您的团队在即将发生的问题影响客户之前没有被寻呼，则需要改善监视和警报。

回应

值: 升级，升级，升级

工程师可以决定的最糟糕的事情是，他们不想唤醒某人，因为这可能不是他们的问题。没有人会介意被事件唤醒并发现不需要它们。但他们会介意他们是否在本应该被唤醒的时候被唤醒。我们应该在同一支球队，队友互相支持。

恢复

值: 事情发生了; 快速清理

客户不在乎为什么您的服务关闭，只关心您尽快恢复服务。毫不犹豫地迅速解决事件，这样您就可以最大程度地减少影响。

如果您是技术负责人，并且知道您可以通过快速重启来恢复服务，但是您也可以在服务仍处于关闭状态时花时间调查原因，您应该怎么做？这个值指导你的答案: 现在恢复，以后再找出原因; 客户体验是第一位的。

学习

值: 总是无可指责

事件是运行服务的一部分。我们都通过让团队负责而不是分摊责任来改善。人为错误绝不是重大事件的根本原因。为什么那个工程师能够将开发版本部署到生产中？命令行错字是如何产生如此毁灭性的影响的？

指责从来都不是适当的回应。找出缺少的保障措施，并将其落实到位。

改进

值: 从来没有发生过两次相同的事件

确定根本原因并确定将防止整个事件类别再次发生的更改。同样的虫子能在别处咬吗？什么情况会导致程序员引入这个bug？承诺按特定日期交付特定更改。

有了这些价值观，下一步就是确保它们付诸实践。我们每月举行一次会议，讨论它们是如何实施的，并剖析不实施的场合。我们呼吁人们关注他们 -- 不关注他们。我们已经将它们添加到我们的文档中以进行事件响应。

服务中断是一件大事: AWS事件影响了前100名零售商中的54家，这只是一个行业领域。您的足迹可能要小得多，但是从比例上讲，停机对您和您的客户的影响可能同样具有破坏性。为您的工程师提供所需的帮助，以在crunchtime做出艰难的决定。他们和您的客户都会感谢您。

返回融道中国首页 >>

　　版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“融道中国”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场。

延伸阅读

为不可避免的事情做准备: 技术失败时要遵循的5个步骤

亚马逊在3月末的大规模互联网中断提醒人们，任何提供公共云服务的公司，无论大小，都需要事件响应计划。停电是生活中的事实;
2021-10-24
Facebook瞄准了与垃圾邮件对抗的AI的低质量链接

假新闻并不是世界上最大的社交网络唯一要消除的令人反感的内容。Facebook正在推出由人工智能算法支持的新政策，这些政策
2021-10-24
Uber更改评级系统以使驾驶员 “更公平”

Uber周三对其评级系统进行了一些更改，旨在使驾驶员的情况更加 “公平”。第一个更改适用于Uberpool，该选项可让您
2021-10-24
如何让您的应用程序为假期做好准备

万圣节来了又去…，如果您还没有这样做，现在是时候开始计划您的企业的寒假策略了! 对于任何拥有应用程序的人来
2021-10-24
极客使用中国市场零件制造自己的iPhone

对大多数消费者来说，智能手机是一个封闭的盒子。你打开它们，给它们充电，使用它们，再次给它们充电，然后继续这样做，直到升级
2021-10-24
聊天机器人是下一个大平台。以下是企业家如何保持领先地位

不管情况如何，寻找下一件大事是人类的天性。这就是我们作为一个物种不断进化的方式。从邮件到电话再到计算机，我们甚至在相互联
2021-10-24
随着全食超市的购买，亚马逊刚刚为大数据买了一个游乐场

上周，亚马逊宣布打算以每股42美元现金收购Whole Foods Markets第四季度。这笔13 7亿美元的收购被誉为
2021-10-24
如何定位您的SaaS业务进行平台销售

我一直说，规模扩大成为大型，可持续和独立特许经营权的公司是为市场提供平台的公司。初创公司不断发展的愿望是从功能到产品再到
2021-10-23

最新文章

为不可避免的事情做准备: 技术失败时要遵循的5个步骤

精彩推荐

图文观赏

为什么负鼠在扰乱你的谷歌本地搜索引擎优化

热门推荐

友情链接：
百度地图融道中国自助投稿山西商业网大军事网中国白银理财网科技金融网贵州热线万隆金银理财网百度地图大事中国中国啤酒网巴中房产网深圳都市网南方站长网