[Russ Cox] 부동 소수점 변환의 혁신: 더 쉽고, 더 빠르며, 더 간단하게

(research.swtch.com)

13P by darjeeling 1일전 | ★ favorite | 댓글과 토론

요약:

Russ Cox가 제안하는 새로운 부동 소수점 변환 알고리즘은 기존의 복잡한 알고리즘(Ryū, Dragonbox 등)보다 단순하면서도 성능이 뛰어납니다.
'Unrounded Scaling'이라는 핵심 프리미티브를 통해 2진수와 10진수 사이의 변환을 64비트 곱셈 한 번 수준으로 가속화합니다.
이 구현은 Go 1.27(2026년 8월 예정)에 포함될 것으로 예상되며, 고정 정밀도 출력 및 최단 거리 파싱/출력을 모두 지원합니다.
기존 구현대비 성능 향상
출력(Printing) 성능: 약 10~30% 향상
파싱(Parsing) 성능: 약 5~15% 향상

상세요약:

1. 배경: 부동 소수점 변환의 고질적인 복잡성

컴퓨터의 2진수 부동 소수점(Floating-point)을 사람이 읽을 수 있는 10진수로 바꾸거나 그 반대로 바꾸는 작업은 수십 년간 수많은 알고리즘(Dragon4, Grisu3, Ryū, Dragonbox 등)이 경쟁해 온 분야입니다. Russ Cox는 과거에 "변환은 쉽지만 속도가 문제"라고 했으나, 이번 포스트를 통해 "빠른 변환 알고리즘도 단순할 수 있다" 는 것을 증명했습니다.

2. 핵심 아이념: Unrounded Numbers (⟨x⟩)

이 알고리즘의 기초는 unrounded 타입입니다. 이는 숫자의 정수 부분뿐만 아니라, 반올림에 필요한 정보(½ 비트와 그 이하의 비트들의 OR 값인 'sticky bit')를 포함하는 2비트의 추가 정보를 유지합니다.

구조: ⟨x⟩ = ⌊4x⌋ | (4x ≠ ⌊4x⌋)
장점: 이 형태를 유지하면 바닥 함수(floor), 천장 함수(ceil), 혹은 부동 소수점에서 가장 중요한 'Round-to-nearest, ties-to-even' 연산을 매우 저렴한 비용으로 수행할 수 있습니다.

3. 고속 비반올림 스케일링 (Fast Unrounded Scaling)

가장 핵심적인 함수는 uscale(x, e, p)입니다. 이는 의 unrounded 결과를 계산합니다.
기존 알고리즘들은 매우 큰 정수 연산을 필요로 했지만, 이 방식은 다음과 같은 원리로 64비트 연산 내에서 처리합니다.

// 개념적 구현 예시 (실제 최적화 버전은 더 복잡함)  
func uscale(x uint64, e, p int) unrounded {  
    // 10^p를 2^k * 정확한 분수로 근사하여 계산  
    // 대부분의 경우 단일 64비트 곱셈(mul64)과 시프트 연산으로 귀결  
}

4. 주요 성과 및 성능

단순성: 구현 코드가 매우 짧아 유지보수가 용이하며, 논리적 증명이 가능합니다.
성능: 벤치마크 결과, 현재 가장 빠르다고 알려진 Dragonbox(출력) 및 Eisel-Lemire(파싱) 알고리즘보다 더 빠른 성능을 보여줍니다.
범용성: 고정 소수점 출력(Fixed-width printing)과 원본을 완벽히 복구하는 최단 거리 출력(Shortest-width printing) 모두에 적용됩니다.

5. 개발자에게 주는 의미

이 알고리즘은 Go 언어 표준 라이브러리에 통합될 예정입니다. 개발자들은 내부적으로 소수점 변환이 일어날 때(예: fmt.Printf("%f", f) 또는 strconv.ParseFloat) 더 적은 CPU 자원을 사용하면서도 정확한 결과를 얻을 수 있게 됩니다. 또한, 복잡한 수치 해석 라이브러리 없이도 unrounded 개념을 통해 정밀한 수치 제어를 할 수 있는 영감을 제공합니다.```