Consiste en convertir los ""runbooks"" (manuales de procedimientos para operaciones) en flujos de trabajo automatizados. Esta práctica baja significativamente el estrés del equipo y acorta el tiempo de recuperación de incidentes al ejecutar tareas de diagnóstico y reparación de forma automática y consistente. Evita las carreras caóticas durante una crisis y facilita la auditoría posterior al incidente, ya que cada acción queda registrada. Se apoya en la definición clara de SLI/SLO para saber cuándo activar las automatizaciones, garantizando una mayor calidad de servicio para el usuario.