굿하트의 법칙를 번박하는 인용으로
피터 드러커가 한 말로 알려진 "측정할 수 없으면 관 리할 수 없다(If you Can't measure it, you Can't manage it)룰 생각했습니다.
더 찾아보니 Drucker Institute에서도 드러커는 그런 말을 한 적이 없다고 합니다.
오히려 반대의 말을 찾았네요.
측정할 수 없으면 관리할 수 없다고 생각하는 것은 잘못된 것이다. - 그것은 값비싼 신화다. (It is wrong to suppose that if you can't measure it, you cant manage it-a costly myth) - 에드워드 데밍(Edwards Deming)
그럼에도 불구하고 유의미한 측정기준은 있을거라 생각해요. 특히 상반되는 두 지표를 모두 책임질 누군가가 있어야 더욱 효과적일것 같습니다. SRE 관점에서 장애건수를 낮췄다고 좋아해도, 그만큼 돌다리 두드리느라 배포가 늦어져서 기능 개발이 더뎌질수 있고, Dev 관점에서 기능 개발 많이 했다고 좋아해도, 그만큼 장애 발생 건수도 많아질수도 있는거니까요.
p99 latency, 응답 성공율, 요청당 비용, MTTR, 장애 발생 건수 같은 지표도 어뷰징하기 어려운 좋은 지표라고 생각합니다. (물론 어뷰징 될수도 있긴하겠지만 추적하고 관리하는게 실보다 득이 더 많을것 같은...)
그렇다면 아마 그 그래프는 오염될 가능성이 높겠군요.
굿하트의 법칙: "측정 기준이 목표가 되는 순간, 그 측정 기준은 더 이상 좋은 측정 기준이 되지 못한다"