GN⁺: 고빈도 거래를 포함한 저지연 애플리케이션을 위한 C++ 패턴
(arxiv.org)C++ 저지연 애플리케이션을 위한 디자인 패턴
- 저자: Paul Bilokon, Burak Gunduz
- 제출일: 2023년 9월 8일
- 주제: 저지연 코드 최적화, 특히 고빈도 거래(HFT) 시스템에 중점
주요 기여
- 저지연 프로그래밍 저장소 생성: 실용적인 가이드로, 엄격한 통계적 벤치마킹 포함
- 시장 중립 통계적 차익 거래 전략 최적화: 속도와 수익성에서 상당한 개선
- Disruptor 패턴의 C++ 구현: 전통적인 큐잉 방법보다 성능 향상
평가 지표
- 속도
- 캐시 활용
- 통계적 유의성 등
주요 기술
- 캐시 워밍: 캐시 초기화로 지연 시간 감소
- Constexpr: 컴파일 시간 상수 평가로 성능 향상
미래 방향
- 저장소 확장
- 최적화된 거래 알고리즘의 실시간 거래 환경 테스트
- Disruptor 패턴과 거래 알고리즘 통합하여 종합적인 시스템 벤치마킹
대상 독자
- 학계 및 산업계 실무자
GN⁺의 정리
이 논문은 저지연 애플리케이션, 특히 고빈도 거래 시스템의 성능을 향상시키기 위한 디자인 패턴을 다룸. 저지연 프로그래밍 저장소와 Disruptor 패턴의 구현은 실무자들에게 유용한 가이드가 될 것임. 캐시 워밍과 Constexpr 같은 기술은 지연 시간 감소에 큰 기여를 함. 이 논문은 성능 최적화에 관심 있는 사람들에게 매우 유익할 것임.
Hacker News 의견
-
주제에 대한 간단한 소개임
-
학부생들은 이미 기본적인 성능 최적화 요소를 알고 있음
- 분기 예측, 캐시 일관성, 명령어 캐시 등의 기본 개념을 배움
-
성능 저하 요인인 false sharing에 대해 다루지 않은 점이 놀라움
-
최적화 힌트 속성([[likely]], [[unlikely]]) 등을 다루지 않은 점도 놀라움
-
고급 성능 최적화 요소는 다루지 않음
- 특정 IO API, 동기화 원시, IPC 메커니즘, 컴파일러 내장 함수 등
-
저지연 프로그래머에게 필요한 것은 불필요한 할당, 복사 등에 대한 경계심임
- 벤치마크를 통해 성능 저하 요소를 찾는 습관이 필요함
-
저지연 서버를 작성할 때 벡터 IO 작업이 작은 객체를 연속 버퍼에 복사하는 것보다 느리다는 것을 깨달음
- 무료 복사는 없다는 점을 강조함
-
테스트 결과는 t-통계량과 p-값을 제공함
- t-통계량은 잔차의 단위근 검정 결과를 나타냄
- p-값은 검정의 귀무가설이 참일 확률을 제공함
-
이 부분은 LLM을 사용해 작성된 것 같음
-
하루 한 번의 종가를 5년 동안 분석하고 65마이크로초 지연으로 스프레드를 계산하는 예시는 이상함
- 내부 루프에서 통계를 계산하지 않음
- 65마이크로초는 내부 루프에 너무 느림
- 최적화 기법을 연습하기 위한 예시로 보임
-
C++로 작성된 주식 거래소 구현체를 공유함
- LMAX disruptor 패턴을 사용함
- Rust로 다시 작성하려고 함
- Rust에서 메모리 관리와 종속성이 더 쉬움
-
C++ 로깅 라이브러리를 작성함
- LMAX disruptor와 유사함
- HFT 커뮤니티에서 사용됨
- 성능 저하 없이 상세한 로깅을 가능하게 함
- 동료들이 성능 저하를 우려해 중요한 정보를 로깅하지 않는 문제를 해결함
-
컴파일 타임 디스패치의 효율성은 함수 호출 결정이 컴파일 단계에서 이루어지기 때문임
- 컴파일러가 호출되는 함수를 정적으로 결정할 수 있으면, 호출된 함수의 코드를 직접 인라인할 수 있음
- 모든 함수 호출 오버헤드를 제거하고 추가 최적화를 가능하게 함
-
CppCon 2017 발표 자료를 공유함
- 마이크로초가 영원처럼 느껴질 때라는 주제임
- 프로 개발자라면 전체 자료를 보는 것이 좋음
-
고빈도 거래가 존재해야 하는 이유가 있는지 의문을 제기함
- 비트코인이 에너지를 낭비한다고 불평하지만, 고빈도 거래는 사회에 순수한 부정적 영향을 미침