리소스의 ID, GUID로 할까 Sequential로 할까?

(twitter.com/dylayed)

23P by kunggom 2022-02-24 | ★ favorite | 댓글 15개

특정한 리소스를 고유하게 지정하는 ID를 어떻게 만들 것인가 하면 보통은 크게 2가지 방법을 주로 쓰는 걸로 압니다. 하나는 DB 테이블의 Primary Key에 Auto Increment를 걸어서 나오는 순차적인 정수값을 그대로 써먹는 것이고, 다른 하나는 랜덤한 128비트 값인 GUID(UUID라고도 함)를 그때그때 생성하여 사용하는 방식입니다.

웹에서 볼 수 있는 수많은 서비스들의 데이터는 RDBMS가 상당수 책임지고 있고, 이런 DBMS의 Auto Increment는 내부적으로 최적화되어 있을 뿐더러 사용하는 개발자 입장에서 이해하기도 예측하기도 쉽고 데이터가 들어온 순서대로 정렬하는 것도 간단합니다. 그저 숫자를 1씩 더해갈 뿐이니까요. 하지만 이 방법은 특정한 경우 보안상 노출되지 않았으면 하는 정보를 외부에 노출할 수 있다거나 (예를 들면 경쟁사에서 우리 서비스의 사용자 숫자 등 주요 지표를 쉽게 눈치챌 수 있음) 또는 분산형 아키텍쳐에서 문제가 될 수 있는 등의 문제점이 있습니다.

GUID를 사용하는 방법은 위와는 특징이 정반대입니다. GUID는 다른 의존성 없이 충돌가능성이 0에 가까운 사실상 고유한 128비트 값을 그때그때 만들어 사용하기 때문에, 분산형 아키텍쳐에서도 아무런 문제가 없을 뿐더러 외부에 다른 유의미한 정보를 뜻하지 않게 흘릴 우려도 없습니다. 그러나 랜덤하게 생성된 값을 RDBMS에 쓰는 것은 성능 저하를 불러올 수 있으며, 또한 그 자체로는 데이터가 들어온 순서대로 정렬하는 것도 불가능합니다. 이러한 약점을 보완하고자 완전한 랜덤이 아니라 시간 정보가 가미되어 불완전한 순차성을 띄는 Timeflake와 같은 것을 사용하는 경우도 있습니다. 제가 직접 써본 적은 없지만, Laravel 같은 프레임워크에서도 이런 방식을 쓴다고 하더라고요.

개인적으로는 지금 다니는 회사에서 Microsoft의 Office 365나 Graph API 등 GUID를 적극적으로 사용하는 물건과 연동되는 제품을 개발하다 보니, GUID를 적극적으로 사용하는 방식도 꽤 괜찮지 않나 하는 생각을 갖게 되었습니다. 하지만 결국 이런 건 사용처와 목적에 따라 무엇이 더 좋은지 달라지는 것이니까, 각 방법의 장단점을 명확히 알아두는 것이 좋겠지요. 그래서 이와 관련된 가상의 서비스 개발자의 일지를 담은 트윗 타래를 소개합니다. (한국어)

kunggom 2022-04-22 [-]

최근 신한카드에서 부정사용 사고가 발생했는데, 이와 관련하여 해당 카드사가 신용카드 번호를 순차적으로 발급하는 바람에 해외로부터의 부정사용에 노출될 수 있는 위험성이 확인되었습니다.
번호만 살짝 바꿨는데 "결제"…도용에 노출된 신용카드
금융감독원, 최근 신한카드 부정사용 등에 대한 대책 강구

리소스의 ID, GUID로 할까 Sequential로 할까?

함께 보면 좋은 글 β

댓글과 토론