URL의 IPv6 zone은 실수
(xeiaso.net)- IPv6 zone은 여러 인터페이스가 같은
fe80::링크 로컬 범위를 쓸 때fe80::4%eth0처럼 대상 인터페이스를 구분하게 하는 표기임 - URL에서 IPv6 주소는 포트와 콜론을 구분하려고
[fe80::4]:80처럼 감싸며, zone까지 붙이면 대괄호 표기가[fe80::4%eth0]:80형식이 됨 - Go의
net/url은]:80을%et라는 잘못된 URL escape로 해석해 invalid URL escape 오류를 냄 - RFC 6874는 zone이 있는 IPv6 리터럴을
IPv6address "%25" ZoneID로 정의하므로, URL에서는%를%25로 percent-encode해야 함 - Anubis가 IPv6 zone 주소를 가리키려면 이 표기를 써야 하며, 브라우저·nginx·Requests 관련 이슈처럼 origin과 라이브러리 호환성까지 걸린 엣지 케이스로 남음
IPv6 zone와 URL 문법 충돌
- IPv6의 링크 로컬 주소는 인터페이스마다
fe80::whatever범위에 놓일 수 있어, 두 네트워크 인터페이스가 있을 때fe80::4목적지를 구분하려면 IPv6 scope/zone) 사용이 필요함 - zone 값의 형식은 운영체제마다 다르며, Linux에서는 인터페이스 이름, Windows에서는 인터페이스 ID를 사용함
- 예시에서
eth0는 이더넷 장치 이름이며, 주소는 다음처럼 표현됨
fe80::4%eth0
- 호스트와 포트는 보통 콜론으로 구분하지만 IPv6 주소도 헥스 그룹 구분에 콜론을 쓰므로, 포트 80의
fe80::4는 다음처럼 대괄호로 감싸야 함
[fe80::4]:80
- zone까지 붙이면 다음 형식이 됨
[fe80::4%eth0]:80
- 이를 URL 호스트명에 직접 넣은
http://[fe80::4%eth0]:80은 Gonet/url에서%et를 잘못된 URL escape로 해석해 실패함
panic: parse "http://[fe80::4%eth0]:80": invalid URL escape "%et"
표준상 해결책과 남은 문제
- URL 문법에 맞지 않는 값은 percent-encoding을 사용해야 하며, URL의
%20은 URL에서 유효하지 않은 ASCII 공백을 인코딩한 예임 - IPv6 zone의
%자체도 인코딩해야 하므로, Go에서는http://[fe80::4%25eth0]:80처럼 써야Hostname()결과가fe80::4%eth0로 나옴 - RFC 9844는 사용자 인터페이스에서 IPv6 zone을 다루는 지침을 제공하며, RFC 6874는 URL의 zone 포함 IPv6 리터럴 문법을 다음처럼 정의함
IP-literal = "[" ( IPv6address / IPv6addrz / IPvFuture ) "]"
ZoneID = 1*( unreserved / pct-encoded )
IPv6addrz = IPv6address "%25" ZoneID
- 같은 엣지 케이스는 nginx 티켓, Requests 이슈, HTTP link-local URI BCP 초안에도 걸려 있음
- 브라우저는 현재 IPv6 zone을 지원하지 않으며, 이유는 많은 미묘한 동작에 쓰이는 “origin” 개념을 깨뜨리기 때문이고, 해당 초안은 브라우저가 사용할 수 있도록 IPv6의 zone origin을 정의하려는 시도임
- Anubis가 IPv6 zone 주소를 가리키려면
%를 percent-encoding해야 하며, Go 표준 라이브러리를 포크하지 않는 정책 아래에서는 이 엣지 케이스의 나쁜 UX를 감수해야 함
댓글과 토론
Lobste.rs 의견들
TL;DR: 컴퓨터는 실수였다는 식의 결론은 목욕물 버리다 아기까지 버리는 느낌 아닌가 싶음
말 그대로 Trigun 같은 애니 악당 논리처럼, 인간이 끔찍한 범죄를 저지를 수 있으니 모든 인간을 없애겠다는 식임
농담 섞인 표현인 건 알지만 흥미롭고, 지금 준비 중인 다음 발표 주제로 삼을 예정임- 제목이 아주 극적이고 낚시성인 건 맞음
그래도 핵심은 공감됨. 이런 상황 자체가 꽤 우스꽝스럽지 않나 싶음
- 제목이 아주 극적이고 낚시성인 건 맞음
- URL에서 링크-로컬 범위 IPv6 주소를 제대로 처리하지 못하는 건 실수임
다만 링크-로컬 IPv6 주소를 제대로 다루지 못하는 경우가 드물지는 않음- 반대로 URL 안의 IPv6 주소에서 존(zone) 을 처리하려면 복잡도가 꽤 늘어남
이제%가 URL의 호스트 부분에서만, 그것도 호스트가 IPv6 주소이고[...]안에 있을 때만 다른 의미를 갖기 때문임
문법이 여전히 모호하지 않을 수는 있지만, 핵심은 그게 아님. 이런 예외 사례가 많아질수록 URL 파서가 특정 예외를 놓칠 가능성이 커지고, 파서 간 차이에서 지저분한 버그나 보안 문제가 숨어들기 쉬움
개인적으로는 URL에서 IPv6 존을 처리하는 쪽을 선호하지만, 한때%를 URL 인코딩해야 한다는 지침이 있었던 만큼 지금 와서 되돌리면 실제로 모호성이 생김. 아쉬운 일임
- 반대로 URL 안의 IPv6 주소에서 존(zone) 을 처리하려면 복잡도가 꽤 늘어남
- RFC 3986와 호환되는 라이브러리나 구현이라면 이 문제를 만나게 됨. 명세가 퍼센트 인코딩된 시퀀스를 이렇게 정의하기 때문임
pct-encoded = "%" HEXDIG HEXDIG
여기서HEXDIG는[a-fA-F]로 정의되어 있어서%et를 잘못된 시퀀스로 파싱함
명세는 또%문자가 퍼센트 인코딩된 옥텟의 표시자로 쓰이므로, URI 안에서 데이터로 쓰려면%25로 퍼센트 인코딩해야 한다고 말함. 이미 디코딩된 문자열을 다시 디코딩하면 퍼센트 데이터 옥텟을 퍼센트 인코딩의 시작으로 오해할 수 있고, 이미 인코딩된 문자열을 다시 인코딩해도 반대 문제가 생기므로 구현은 같은 문자열을 두 번 이상 인코딩하거나 디코딩하면 안 된다고 함
그래서 짜증나는 건 맞지만, 실제로는 버그라기 어렵다고 봄 - 존이 있는 주소에
%를 직접 쓰는 게 왜 그렇게 끔찍한가 싶음. 인코딩된 문자는 호스트 부분에서도 허용되고, 존 주소에%를 그대로 쓰면 모호성이 생김
%자체는 예약되지 않은 문자가 아니므로 퍼센트 인코딩하는 게 맞음
Go의net/url과net/http가 URL RFC와 충돌하는 건 새삼스러운 일이 아님. 특히net/url.URL.Path의 존재와net/http에서의 사용이 꽤 성가신데,%2F를 깨뜨리기 때문임.net/http.Redirect도path.Clean을 사용해서//를/로 잘못 접어버림
Go 표준 라이브러리에서 URL을 만지는 부분을 포크하고 싶거나net/url/v2같은 걸 제안하고 싶은 이유는 많음. 하지만 이 글에서 보이는 한, Go의 IPv6 존 주소 처리는 타당하고 올바른 편으로 보임