10P by before30 2020-12-26 | favorite | 댓글 1개

https://how.complexsystems.fail/
https://www.youtube.com/watch?v=2S0k12uZR14

Richard Cook의 How Complex System Fail 에서는 18가지의 복잡한 시스템의 실패 원인과 실패를 줄이기 위한 방법을 다루고있어요.

## 1. 복잡한 시스템은 본질적으로 위험한 시스템이다.

## 2. 복잡한 시스템은 실패로부터 성공적으로 방어한다.
장애가 발생하면서 여러 계층의 방어 레이어를 구축한다. 이런한 방어는 기술구성요소(백업, 시스템 safety feature 등) 인적 구성(교육, 지식), 조직, 제도 등을 포함한다.

## 3. 대참사(Catastrophe) 여러번의 실패가 필요하다. - SPoF로는 충분하지 않다.
큰 장애는 작은 사고들이 합쳐져서 생겨난다.

## 4. 복잡한 시스템에는 내부에 잠재되어있는 변화하는 오류 조합이 포함되어 있다.

## 5. 복잡한 시스템은 성능 저하 모드로 실행된다.

## 6. 대참사(Catastrophe)는 언제나 코앞에 있다.

## 7. 장애 이후 Root Cause는 근본적으로 잘못되었다.

## 8. 장애 이후의 성과 평가는 사후 평향적이다.

## 9. 운영에는 두가지 역할이 있다. (생산자, 장애에 대한 방어자)

## 10. 모든 실무자의 행동은 도박이다.
장애 이후에 실패는 종종 피할 수 없는 것 처럼 보이며, 실무자의 행동은 실수로 보인다. 그러나 모든 실무자의 행동은 실제로 도박, 즉 불확실한 결과에 직면하여 발생하는 행동이다. 불활실성의 정도는 변할 수 있다. 실무자의 행동이 도박이라는 사실은 장애 이후에 알게된다. 일반적으로 사후 분석에서는 이러한 도박을 빈약한 도박으로 간주한다. 그러나 성공적인 결과 또한 도박의 결과이기도 하다.

## 11. 가장 어려운 곳에서의 행동은 모호함을 해결한다.

## 12. 실무자는 복잡한 시스템의 적응 가능한 요소이다.

## 13. 복잡한 시스템에 대한 인간의 전문성은 끊임없이 변화하고 있다.

## 14. 변화는 새로운 형태의 실패를 가져온다.

## 15. '원인'에 대한 견해는 미래의 사건에 대한 방어의 효율성을 제한한다.

## 16. 안전은 구성 요소가 아니라 시스템의 특성이다.
안전은 시스템의 속성이다. 모든 시스템의 안전 상태는 항상 변한다. 지속적이며 체계적으로 위험에 대한 관리가 필요하다.

## 17. 사람들은 지속적으로 안전을 만든다.

## 18. 실패없는 작업에는 실패 경험이 필요하다.

요즘 카오스엔지니어링을 준비해서 그런지 몰라도 아래 글들이 인상에 남네요
- 대참사(Catastrophe)는 언제나 코앞에 있다.
- 실패없는 작업에는 실패 경험이 필요하다.