고차원 공간에서 “내적이 특정 값 이상일 확률”을 구하는 방법은 간단한 원리에 바탕을 두고 있다. 단위 구의 표면적을 구하고, 해당 내적이 나타내는 각도를 통해 캡 면적을 산출한 다음, 이를 전체 표면적과 비교하면 끝이다.

하지만 이 간단한 계산을 통해, 실제로 내적이라는 값이 고차원 임베딩 공간에서 얼마나 ‘희귀하거나 흔한’ 사건인지를 구체적으로 파악할 수 있다는 점이 핵심이다. 특히 0.9 이상의 내적이 극단적으로 드물다는 사실은, 임베딩 기반 검색(에서 높은 유사도 점수가 얼마나 중요한 시그널이 될 수 있는지를 잘 보여준다.