- 옵저버빌리티: 시스템 외부 출력의 결괏값에서 시스템 내부 상태를 얼마나 잘 추론하는지 나타내는 척도
- 메트릭, 이벤트, 로그, 트레이스를 수집해 시각화하고 분석
- 내부 동작 배경 정보를 풍부하게 제공, 심층적인 시스템 문제 해결
- Grafana Labs, Splunk, Dynatrace, Chronosphere 등 옵저버빌리티 기업과 Dimensional Research 등 시장조사기관이 제시한 2024년 옵저버빌리티 트렌드 중 3회 이상 지목된 트렌드 중 5가지 정리
- 옵저버빌리리티 ‘도구’로서 AI 영향력 확대
- AI는 신호 상관, 이상 징후 탐지, 근본 원인 분석, 성능 최적화 업무에 쓰여 ‘시스템에서 일어나는 일’ 빨리 이해하도록 도움
- AI가 이상 징후 탐지하면 조사와 자동 대응 거쳐 문제 자동 해결
- 일상 프로세스 자동화해 장시간 작업 줄이는 도구 수요는 옵저버빌리티서 AI 활용도 높임
- 클라우드 네이티브 제공 속도 따라가려면, 조직이 멀티 클라우드 인프라와 애자일 개발 관행을 대규모로 자동화한, 정확하고 예측할 수 있는 AI 기반 분석 필요
- 인과·예측·생성형 AI 결합한 옵저버빌리티 도구 활용하면 옵저버빌리티, 보안, 비즈니스 데이터서 통찰 풍부하게 얻어 시스템 심층 분석 가능
- 물론 ‘고객이 원하는 수준으로 AI가 신뢰성을 달성했다’고 보려면 시간이 걸림
- 옵저버빌리티 ‘대상’으로서 AI 관측 중요성 증가
- 생성형 AI는 자동화와 생산성 무기로 방대하고 복잡한 데이터 폭발적 속도로 생성
- 사용자는 AI로 콘텐츠 만들고 ‘자신만의 AI’도 직접 개발해 여기서 발생하고, 처리할 데이터 많음
- AI는 의료, 법률, 금융, 여행 등 사회 각 분야에 광범위한 영향력 미치므로 잘 이해해야 함
- AI의 정상 동작 여부나 편향성 등은 중요한 관측 대상
- 조직은 AI를 정확하고 구체적으로 관측할 준비가 돼 있어야 함
- AI에서 메트릭, 로그, 트레이스 가져오는 방법 알아야 함
- 옵저버빌리티 비용 절감 노력
- 많은 기업이 예산 문제 고민, 기술·사업 측면서 비용 관리 방법 모색, IT 비용 전반 관리
- 기업이 멀티 클라우드나 클라우드 네이티브 환경으로 전환하면서 생성되는 데이터양 늘고, 관련 비용 증가
- ESG 리서치, “조직 69%가 옵저버빌리티 데이터 증가 때문에 시간 지나면서 데이터 수집·저장 비용 크게 들어 우려”
- Dynatrace, “팀은 실시간 분석을 위해 유지할 로그, 폐기할 로그, 접근성 낮은 저비용 스토리지에 보관할 로그를 자주 결정해야 함”
- 옵저버빌리티 비용 절감 방안:
- 데이터 증가 억제, 조직이 수집한 데이터서 더 나은 가치 얻도록 돕는 도구 사용
- 옵저버빌리티 결과에 가치 주지 않는, 중복되고 관련 없는 이벤트 필터링
- 빈값 제거, 불필요한 레이블 삭제, 비효율적인 데이터 포맷→‘옵저버빌리티 대상에 맞는 포맷’으로 변환, 이벤트 트리밍, 변환
- 오픈 소스와 Open Telemetry 수요 상승
- 많은 기업이 공급업체에 종속될 우려 해결 위해 오픈 소스 기술 투자, 이를 옵저버빌리티 기술 스택 일부로 통합
- Dimensional Research 설문조사 따르면, 옵저버빌리티 담당자인 응답자 중 87%, “OpenTelemetry는 앞으로 5년 내 옵저버빌리티 데이터 표준 될 것”
- OpenTelemetry는 트레이스, 메트릭, 로그 등 데이터 생성, 관리하도록 설계, 특정 공급업체 종속 X
- 이는 OpenTelemetry 지원하는 모든 옵저버빌리티 도구와 함께 사용 가능
- But OpenTelemetry 도입은 아직 초기 단계
- OpenTelemetry 도입 시 기술 지원 우려, 시장 도입 확대될 때까지 기다릴 필요성, 경영진 가치 이해 부족 등 문제
- 옵저버빌리티 도구 통합 행보 강화
- 여러 옵저버빌리티 도구 사용 대신 공급업체 한두 곳 도구로 통합 움직임 강화
- Dimensional Research 설문 조사 결과, 기업서 옵저버빌리티, 모니터링 도구 평균 7가지 이상 사용
- 옵저버빌리티 도구 통합 이유: 더 빠른 문제 확인, 비용 절감, 팀 협업 개선, 다운타임 최소화, 보안 강화, 운영 복잡성 간소화, 교육 필요성 감소, 데이터 사일로 방지 수요
- Chronosphere, “개발자와 기술팀은 답 찾기 위해 다양한 사용자 인터페이스나 소프트웨어 오가는 데 시간 쓰거나, 여러 소프트웨어에 비용 들이길 원치 않는다”
- Dimensional Research, “도구가 너무 많으면 데이터 상관관계 보여줄 때 어려움 커져 환경 전반에 가시성 제한하는 ‘도구 사일로 현상’ 초래”
- 옵저버빌리티 도구를 공급업체 한두 곳의 도구로 통합하면 파편화된 데이터를 모으고, 데이터 수집·소비 방식 표준화하기에 좋음