한국 정부 클라우드 저장소 시스템, 화재로 소실 및 백업 부재
(koreajoongangdaily.joins.com)- 대전의 National Information Resources Service(NIRS) 서버실 화재로 정부 G-Drive 클라우드 데이터 완전 소실 발생
- 약 75만 명의 공무원 개별 업무 파일 영구 삭제 문제
- 대용량, 저성능 스토리지 구조로 인해 외부 백업이 없었던 점이 치명적 약점임
- 일부 부처, 특히 Ministry of Personnel Management 피해 심각, 복구는 제한적
- 데이터 관리 체계에 대한 비판 확대 및 재발 방지 요구 증가
NIRS 화재로 인한 정부 클라우드 스토리지 시스템 소실 사건 개요
- 대전 National Information Resources Service(NIRS) 본관에서 9월 27일 발생한 화재로 정부의 G-Drive 클라우드 저장소 시스템이 소실됨
- 내무부(Ministry of the Interior and Safety) 발표에 따르면 75만 명의 공무원이 개별적으로 저장한 업무 파일이 모두 삭제됨
피해 및 영향
- 화재는 센터 5층 서버실에서 발생하여 중앙 정부 업무에 필수적인 96개 정보시스템 및 G-Drive 플랫품에 결정적 손상 유발함
- 2018년 도입된 G-Drive는 공무원들에게 모든 업무 문서를 개인 PC가 아닌 클라우드에 저장하도록 강제함
- 1인당 약 30GB 용량 제공 구조였음
백업 미흡과 데이터 영구 소실 원인
- 대용량, 저성능 스토리지 구조로 인해 외부 백업을 하지 않는 체계로 설계되었음
- 이 구조적 한계로 인해 화재로 인한 데이터 복구 불가능 상황 초래됨
기관별 피해 차이
- 기관마다 피해 규모가 다름
- Ministry of Personnel Management는 모든 문서를 G-Drive에 의무 저장하여 가장 큰 피해를 입음
- Office for Government Policy Coordination 등 일부 기관은 상대적으로 피해가 적음
복구 노력 및 한계
- 각 부처는 최근 한 달간 개인 PC에 저장된 파일, 이메일, 공식문서 및 인쇄 기록 등 대체 데이터를 통한 한정적 복구 진행 중임
- 공식 결재 및 보고로 생성된 문서 일부는 Onnara 시스템에도 보관되어 있어 해당 시스템 복구 시 일부 데이터 회수 가능성 존재함
데이터 관리 체계에 대한 지적
- 일상적으로 대부분 시스템은 센터 내 별도 기기와 원격 백업시설에 매일 백업되고 있으나, G-Drive는 구조상 외부 백업 불가로 이례적 취약점 보유
- 이번 사고를 계기로 정부의 데이터 보안 및 관리 체계에 대한 비판 고조 및 재발 방지 대책 마련 필요성 제기됨
Hacker News 의견
-
백업이 없다는 사실에 분노를 느낌, 하지만 실제로 책임을 묻기 전에 상황을 더 알고 싶음
1990~1991년 첫 컴퓨터 담당자로 일할 때 멘토에게서 "백업이 잘 되고 있는지 확인하는 것이 네 일이고, 나머지는 덤"이라는 조언을 받았던 기억이 있음
당시 테이프 백업 시스템이 포화되어 14400bps 모뎀으로 두 지점 간 중요 데이터를 복제하기 시작했으며, 매달 작동하는 백업 시스템을 요청하는 메모를 남겼으나, 회사가 비용 문제로 외면했음
서버 하드디스크가 고장났을 때, 베어링 문제로 보이고 하드케이스를 열어 손가락으로 플래터를 돌려 몇 주간 연명했음, 문제의 심각성을 보여주기 위해 매니저가 직접 보게 했고, 결국 새 하드는 구입했지만 미러링용 추가 하드는 안 사줬음
퇴사 후 한 달 만에 서버 장애 발생 후 나를 탓하려 했지만, 후임자가 내가 남긴 메모 뭉치를 찾아 상황을 바로잡을 수 있었음 -
기사 마지막 부분에
이 기사는 원래 한국어로 작성되어, 2개 국어를 구사하는 기자가 생성 AI 도구의 도움을 받아 번역한 후, 영어 원어민 에디터가 편집함. 모든 AI 번역은 뉴스룸에서 검수 및 수정함
이렇게 명확하게 고지되어 있어 좋음
자연어 업무에 LLM 사용에 대해 솔직하게 공개만 한다면 괜찮다고 생각함-
LLM 기술 자체가 원래 번역 목적으로 개발된 것이 사실임
문맥을 다룰 수 있는 모델을 만들기 위한 필요 때문에 연구가 이뤄졌고, 이후 여러 분야에도 유용하게 쓰이게 된 것임
번역 분야에서는 이미 5년 넘게 LLM 기반 기술이 성능 좋게 활용되고 있음 -
여러 해 동안 이런 방식으로 번역을 해왔었음, LLM 전에도 내가 잘하는 언어들 사이에서 기계번역을 먼저 돌리고 수정하는 게 내가 처음부터 직접 번역하는 것보다 훨씬 빠름
(기계번역이 LLM인지 아닌지는 실제 번역 업무 흐름에선 큰 이슈가 아님) -
여전히 전혀 소용없는 결과라고 생각함
AI가 내 번역가 일자리를 앗아갔다는 글 참고
-
-
관련 링크 공유함
-
타임라인을 보면 소름임
화재가 발생한 바로 그날이 정부의 현장점검(중국/북한 해킹 관련)이 시작되던 예정일임 -
기사 인용
한국 전국망 복구를 총괄하던 고위 정부 공무원이 세종에서 스스로 목숨을 끊었다는 보도 있음
-
이런 연대기 자료를 보면 권력에 맞서 옳은 말을 하려는 생각을 접게 됨
그냥 자료 삭제하고 장비 폐기 후 버스타고 다른 도시, 다른 직업 찾아 떠나야 한다는 생각이 듦 -
긍정적으로 보자면, 기술적으로는 백업이 있긴 했을 가능성이 높음(1.3절 참고)
단지 그 백업이 북한이나 중국에 있다는 소문이라는 게 문제임
충격임 -
이 기사에서 가장 중요한 내용은 아니지만, 왜 기사 저자들까지 자신들의 계정이 정지당했는데도 Proton을 옹호하는 것인지 모르겠음
한국 정보기관 소속 인사가 Proton이 안전하지 않다고 경고했다는 후기가 있음에도 불구함
기술적으로 완벽히 안전하다 해도, 사람들이 생각하는 것만큼 도덕적 나침반이 확실한 회사가 아님을 보여줌
-
-
상업용 AWS/GCP/Azure를 신뢰할 수 없다는 정부 관료는 당분간 몸을 낮추고 있을 듯함
"행정안전부는 대전 데이터센터의 대부분 시스템은 동일 센터 내 별개 장비와 물리적으로 떨어진 백업 시설에 매일 백업이 이뤄지고 있지만, G-Drive 구조상 외부 백업이 불가능하다"고 설명함
진짜 말도 안 되는 상황이라 생각함-
여기서 문제는 외국 기업 사용 거부가 아니라고 봄
외부 저장소 사용 의무를 부과하면서도 실제로 백업을 안 한 게 미친 행정임
화재는 가장 기본적으로 염두에 두는 리스크인데, 이 정도 준비조차 안 한 게 믿기지 않는 관리 부실임 -
이런 중대한 시스템을 백업 없이 운영했다는 것에 동의
하지만 그럼에도 불구하고, 정부 차원에서 중요한 데이터를 외국 클라우드에 두는 것은 적절치 않다고 생각함 -
클라우드를 썼더라면 중복성은 쉽게 만들어졌겠지만, 그것만이 유일한 방법은 아니었음
애초에 설계 개념 자체가 잘못됐고, 실질적 이중화가 없는 구조였음 -
이 문제의 간단한 해결책은, 여러 대의 netapp에 snapmirror로 2차 백업 사이트를 뒀거나
ZFS, DRBD 같은 오픈소스 솔루션을 썼어도 됐음
요즘은 이런 대안이 누구나 쓸 수 있을 만큼 많음 -
이런 회사들이 절대 데이터를 잃지 않는 것처럼 생각하지만, 번개에 데이터센터가 날아간 적도 있음 (관련기사)
정부 입장에서는 데이터가 타국 사기업이 관리하는 환경에 위치하면 안 된다고 생각함
백업 문제와는 완전히 별개의 이슈임
-
-
대용량·저성능 저장구조 때문에 외부 백업을 운용하지 않아 영구적 데이터 손실
이런 자료라면 최소한 한 번의 이중화는 했을 거라 기대하는 상황임
약 75만 명의 공무원이 각자 저장한 업무파일 삭제
1인당 30기가 저장공간
총합 22,500TB, Backblaze 저장소 50대 정도 임
심지어 로컬 미러링도 할 수 있었을텐데 아쉬움 -
기사 댓글을 떠나, 진짜로 백업이 전혀 없었는지는 불분명함
"외부" 백업이 없었던 것만은 확실해 보이나, "내부" 백업은 있었을 수도 있음
백업을 허용하지 않고 모든 데이터를 한 곳에 몰아넣는 식이면 외부 해킹에는 표적이 될 수도 있고, 내부적으로는 fire vault(방폭·방화 금고) 같은 물리 백업 설비가 있는 경우도 많았던 경험 있음
물론, 정말 이런 설비조차 없었다면 엄청난 실수임
참고로, 수십년 전 논문에도 이런 아카이빙 설비 구축이 가능하다는 사례 있음(IBM 프로젝트 논문) -
재미있는 점은, 몇 주 전 네팔에서도 비슷한 일이 있었음
시위대가 일부 정부건물을 불태우면서 IT 인프라까지 소실, 결국 모든 전자 데이터가 거의 증발했음-
만약 이 서류들이 아날로그로 남아 있었더라도 결과가 달라졌을까 궁금함
전자데이터는 백업이 가능하다는 점이 장점이지만, 종이로만 운영했다 해도 상황이 더 나았을 것 같진 않음 -
반권위적 애국자들이었나 의문임
-
블레이드러너 영화에서도 비슷한 일이 벌어졌었음
-
-
며칠 전 GKS(대한민국 정부초청 외국인 장학생 선발) 지원 사이트가 여러 날 동안 접속불가였는데, 실제로 데이터가 전부 소실됐다는 게 충격임
지금이야말로 더 나은 웹사이트 시스템을 구축할 기회라 생각함
현재 한국에서 굉장히 중요한 정보들이 한순간에 증발해버려, 커뮤니티에서 큰 이슈가 되고 있고 많은 사람들이 언급 중임- 정부 기술 생태계에는 실질적인 영향이 크게 미치지 않는 프로그램이었을 듯함
-
귀한 데이터가 상당 부분 완전히 사라졌을 거라 확신하지만, 한편으론 관리부서에 "만약 미러 데이터베이스를 비공식적으로라도 돌리고 있던 그림자 IT 인력이 있으면, 지금 신고해도 아무 책임 묻지 않겠다"라는 안내가 돌 것 같아 미소가 나옴
나도 예전에, 진짜 핵심 데이터의 정본이 계속 바뀌거나 서버가 꺼지거나 꼬이거나 할 때 비공식적으로라도 별도로 백업을 만든 경험이 있음 -
많은 사람들이 미국 클라우드 사용 거부가 문제라고 하지만, 그게 핵심은 아니라고 생각함
상황에 따라 자체 인프라를 운영하는 건 충분히 합리적인 결정임
그러나 이 사례처럼, 보안과 프라이버시를 앞세운 나머지 "가용성"을 희생시킨 점이 가장 큰 문제임
물리적 재해(화재·지진)나 인재로 데이터를 잃는 리스크는 언제나 상존함
이런 위험을 막지 못하는 시스템은 절대 배포하면 안 됨
행정안전부 설명대로 대전 데이터센터의 대부분 시스템은 다른 곳에 백업이 있지만, G-Drive는 구조상 외부 백업이 안 됨
이런 위험을 알고도 리스크를 감수하기로 한 것이고, 그 결과가 이렇게 나타난 상황임