차례:
이를 방지하기위한 최선의 노력에도 불구하고 IT 사고는 피할 수없는 일입니다. 비즈니스에 영향을 미치는 다운 타임을 앞서 기 위해 노력하는 것은 점점 까다로워지고 있습니다. 오늘날의 시스템은 긴밀하게 연결되고 점점 복잡해지고 있으며, 움직이는 부품이 많을수록 문제가 발생할 기회가 더 많습니다.
이것이 더 많은 조직이 서비스 가용성을 높이고 장애에 대한 복원력을 높이기 위해 마이크로 서비스로 전환하는 이유 중 하나입니다. 그러나 이것들은 모 놀리 식 애플리케이션을 깨기위한 훌륭한 전제이지만, 탄력성을 염두에두고 명시 적으로 설계하지 않는 한 실패의 위험을 잠재적으로 악화시킬 수 있습니다.
실패 준비
분산 시스템의 본질적으로 혼란스러운 특성을 고려할 때 서비스는 장애를 예상 할뿐만 아니라 장애가 발생한 경우 자동으로 복구되도록 개발되어야합니다. 이는 시스템이 최종 고객에 대한 서비스를 중단시키지 않고 혼란을 처리 할 수 있도록 정기적으로 장애를 유발하는 것을 의미합니다. 이를 위해서는 테스트 환경에서 프로덕션과 같은 트래픽을 시뮬레이션 할 수 있어야합니다.