开发运维团队专注于寻找更有效的方法来构建、测试和部署软件,这在一定程度上需要快速处理事件。与 ITIL 事件管理一样,开发运维事件管理的目标是在不中断运营的情况下解决问题。例如,开发运维团队可能会监控较差的平均故障间隔时间 (MTBF) 指标,这可能表明存在需要调查的根本问题。
由于开发运维植根于持续改进,因此人们非常注重事后分析和无指责的透明文化。目标是优化整体系统性能,简化并加速事件解决流程,以及防止今后发生同类事件。
与如今的 IT 团队一样,开发运维团队经常使用自动配置、事件优先级排序和支持人工智能 (AI) 的根本原因分析工具来确保正常运行时间,首先处理最紧迫的事件,并学习如何更快地解决今后的问题。(或者从一开始就采取行动,防止发生此类问题。)