2P by GN⁺ 22시간전 | ★ favorite | 댓글 1개
  • exp(x) − ln(y) 형태의 단일 이항 연산자 EML이 모든 초등함수와 상수를 생성할 수 있음이 제시됨
  • 이 연산자와 상수 1만으로 산술 연산, 초월함수(sin, cos, log, √ 등), 복소 상수(e, π, i) 를 모두 표현 가능
  • 모든 EML 표현식은 동일한 노드 구조의 이진 트리로 구성되어, 기호 회귀와 경사 기반 학습에 활용 가능
  • EML은 NAND 게이트의 수학적 대응체로, 연속 수학에서의 단일 보편 연산자 역할 수행
  • 이 발견은 모든 초등함수가 단일 생성 규칙으로 환원 가능함을 보여주며, 수식 탐색과 심볼릭 AI의 새로운 가능성 제시

단일 이항 연산자 EML의 정의

  • eml(x, y) = exp(x) − ln(y) 형태의 단일 이항 연산자가 모든 초등함수를 생성할 수 있음이 제시됨
    • 이 연산자와 상수 1만으로 산술 연산(+, −, ×, /, 거듭제곱), 초월함수(sin, cos, log, √ 등), 상수(e, π, i) 를 모두 표현 가능
    • 예시로 ex = eml(x, 1), ln x = eml(1, eml(eml(1, x), 1)) 형태로 표현 가능
  • EML(Exp–Minus–Log) 연산자는 복소수 영역(C) 에서 계산 수행
    • 상수 1은 ln(1)=0을 통해 로그 항을 중화하는 역할 수행
    • ln(−1) 계산을 통해 iπ 등의 복소 상수 생성 가능
  • 이 연산자는 디지털 논리의 NAND 게이트에 대응되는 연속 수학의 단일 기본 연산자로 제시됨
    • NAND가 모든 불리언 논리를 구성하듯, EML은 모든 초등함수를 구성

단일 연산자 기반 계산기의 개념

  • “두 버튼 계산기” 개념 제시
    • 하나의 이항 연산자(EML)와 하나의 상수(1)만으로 과학용 계산기의 모든 기능 수행 가능
    • 추가 연산자 없이도 모든 실수 및 복소수 초등함수 계산 가능
  • 더 이상의 연산자 수 축소는 불가능함
    • 최소한 하나의 이항 연산자와 하나의 단말 기호(상수)는 필요

EML 표현의 구조적 특징

  • 모든 EML 표현식은 동일한 노드로 구성된 이진 트리 구조를 가짐
    • 문법 형태: S → 1 | eml(S, S)
    • 이는 Catalan 구조완전 이진 트리와 동형인 문맥 자유 언어로 해석 가능
  • 이러한 균일한 구조는 기호 회귀(symbolic regression) 에서 경사 기반 최적화(Adam 등) 적용을 가능하게 함
    • EML 트리를 학습 가능한 회로로 사용하여, 얕은 트리 깊이(최대 4) 에서 정확한 닫힌형 초등함수 복원 가능
    • 생성 법칙이 초등함수일 경우, 학습된 가중치가 정확한 수식 형태로 수렴 가능

발견 과정과 수학적 함의

  • EML 연산자는 체계적 전수 탐색(exhaustive search) 을 통해 발견됨
    • 탐색 결과, EML이 과학용 계산기의 완전한 연산 기반을 구성함이 확인됨
  • 연산자 수를 점진적으로 줄이는 “고장난 계산기(broken calculator)” 접근법을 사용
    • 4개 → 3개 → 2개 → 1개 연산자로 축소하며 완전 기능 유지
  • EML은 예상치 못한 단순성을 가지며, 초등함수 자체로 정의된 이항 연산자
  • EML의 존재는 초등함수들이 훨씬 단순한 생성적 계층에 속함을 보여줌
    • 다양한 함수들이 exp와 ln의 조합으로 환원 가능함을 확장
  • 단일 반복 가능한 구성요소로 모든 수학식을 표현할 수 있어,
    • 전자회로의 트랜지스터 기반 구성과 유사한 수학식의 회로적 표현 가능
  • 이러한 균일 회로 표현은 수식 탐색, 평가, 학습의 새로운 가능성 제시

관련 개념과 역사적 맥락

  • 단일 기본 요소의 보편성은 수학·공학·생물학 전반에서 중요한 개념으로 다뤄짐
    • 예: NAND/NOR 게이트, ReLU 활성함수, K,S 조합자, OISC(SUBLEQ), Rule 110 셀룰러 오토마톤
  • Sheffer형 원소는 드물며, 발견에는 시간·계산·운이 필요함
    • EML은 이러한 Sheffer형 연속 연산자의 한 예로 제시됨
  • 로그와 지수의 상호 표현성(x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) 및 오일러 공식(e^{iφ} = cos φ + i sin φ) 등 기존의 축소 관계를 기반으로 함

초등함수 집합과 향후 확장

  • 연구는 과학용 계산기 수준의 초등함수 집합을 출발점으로 삼음
    • 상수: π, e, i, −1, 1, 2, x, y
    • 단항 함수: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh 등
    • 이항 연산: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
  • 이 전체 집합을 단일 연산자 EML과 상수 1로 완전히 대체 가능함을 입증
  • 초기 탐색에서 더 강력한 성질을 가진 유사 연산자도 발견됨
    • 예: 상수를 필요로 하지 않는 삼항(ternary) 변형 연산자
  • EML은 연속 수학의 단일 생성 연산자 존재 가능성을 보여주는 출발점으로 제시됨
    • 향후 수식 자동 발견, 심볼릭 AI, 수학적 표현 최적화 등 다양한 응용 가능성 존재
Hacker News 의견들
  • 이 접근법이 특별하거나 계산량이 가장 적은 방식은 아님
    예를 들어 f(x, y) = 1/(x - y)로 정의하면 이것도 보편적 연산자가 됨
    x#y = 1/(x - y)로 두면, x#0 = 1/x로 역수를 얻고, (x#y)#0 = x - y로 뺄셈을 표현할 수 있음
    이런 식으로 역수와 뺄셈만으로 네 가지 기본 연산을 구성할 수 있다는 게 흔한 문제임
    관련 짧은 증명은 이 노트에 있음

    • 흥미로운 부분은 이 접근이 상수 e, π, i까지 포함한다는 점임. 덧셈, 곱셈, 지수, 로그 등 초월함수까지 다룸
    • 네가 말한 f(x, y) 방식은 어떤 개념을 표현하려면 극한(limit) 이 필요하지만, EML 접근은 시스템 모델을 표현하는 계산 트리 구조로 되어 있음
    • 좋은 발견임. 1935년 논문(PNAS 논문)을 인용하고 있고, 관련 논의는 MathOverflow에서도 이어짐
    • 그럼 이런 단일 표현으로 삼각함수도 유도할 수 있는지 궁금함
    • 하지만 이 방식으로는 e, π, exp, log 같은 표준 상수나 닫힌 형태 표현은 다루기 어려울 것 같음
  • FRACTRAN 형태의 아이디어가 메인 페이지에 올라온 걸 보니 반가움
    1비트 스택을 이진수로 인코딩하는 방식이 떠오름.
    0을 push하면 수를 두 배로, 1을 push하면 두 배 후 1을 더함. pop은 2로 나누는 것과 같음
    나는 이런 아이디어를 기반으로 한 Rejoice라는 연결형 언어를 씀. 데이터는 곱셈으로 합성되는 멀티셋으로 표현됨
    Rejoice 위키

    • 스택의 크기를 추적해야 앞쪽의 0이 있는지 알 수 있지 않음?
    • 지금 설명이 그냥 2진수의 기본 원리를 새롭게 말한 것 같음
  • 이건 LLM 성능을 테스트하기 좋은 벤치마크

    논문: https://arxiv.org/pdf/2603.21852
    "2x + y"를 EML 조합으로 표현하시오
    

    Opus(paid)는 “2”가 순환적이라며 실패했지만, ChatGPT가 이미 했다고 하니 성공함
    ChatGPT(free)는 한 번에 성공, Grok은 깊이 추정, Gemini는 성공, Deepseek은 PDF를 불러오지 못함, Kimi는 중간에 멈춤, GLM은 괜찮았음

    • LLM을 도발(taunt) 하면 더 잘한다는 걸 오늘 배움. 경쟁심이 있나 봄
    • DeepSeek에 초록만 복사해 넣었는데 결과를 냄. PDF를 모른다고 감점하는 건 불공평함
    • 이런 실험 좋아한다면 Terminal Bench Science에 기여해보길 권함
    • 프롬프트를 이렇게 바꿔봄:
      eml(x,y)=exp(x)−ln(y)
      sin(x)/x를 EML과 상수 1로 표현하시오
      
    • meta.ai instant 모드도 한 번에 성공함
      2x + y = \operatorname{eml}\Big(1,\; \operatorname{eml}\big(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(L_2 + L_x, 1), 1) \cdot \operatorname{eml}(y,1)),1)\big),1\big)\Big)
      
      Gemini는 EML을 “elementary mathematical layers”로 착각함
  • 단일 변수의 36가지 서로 다른 2단계 EML 함수를 시각화함
    앞의 18개는 실수 출력, 나머지는 중간에 복소수 값을 포함함
    이미지 링크

    • 이런 식으로 고정된 깊이의 이진 트리 함수를 모두 분류하고, 트리를 이진수로 인코딩하면 재미있을 듯함
      오래된 수학책의 함수표들이 단순한 해시 조회로 재해석될 수도 있음
  • “EML과 숫자 1만으로 모든 계산이 가능하다”는 말이 Iota combinator를 떠올리게 함
    최소한의 형식 체계로 튜링 완전성을 달성하는 개념과 닮음

  • 현재 논문 링크가 v1이라 그림이 빠져 있음. v2로 바꿔야 함
    아직 읽는 중이지만, 사실이라면 수년 만의 큰 발견일 수도 있음
    스플라인이나 다항식 대신 EML 트리로 데이터나 파동함수를 피팅할 수 있다면,
    다변수 함수도 gradient descent로 학습해 EML 근사 트리로 변환 가능함
    슈뢰딩거 방정식의 도함수 조건을 맞추는 식으로 학습할 수도 있음
    너무 좋아 보여서 의심스럽지만, 이런 일이 실제로 일어난 적이 있었음

    • 내가 1년간 이 분야를 연구한 경험상, EML은 강력하지만 표현식 폭발이 문제임
      곱셈 하나 표현하려면 깊이 8의 트리와 41개 이상의 리프가 필요함
      최소 연산 집합의 우아함과 표현 길이의 트레이드오프가 있음
      나는 Operad 이론Category Theory를 활용해 스펙트럴 신경망과 symbolic regression을 결합하는 접근을 해왔음
    • 모든 불리언 논리를 NAND로만 구현하지 않는 이유와 같음. 계산 효율성 때문임
      다항식은 표현력 대비 계산이 빠름
    • 논문은 흥미롭고 우아하지만, 회귀나 최적화의 경쟁적 대안은 아님
      네가 말한 건 기존의 symbolic regression과 유사함. 이미 성숙한 분야임
    • EML 기반은 멋지지만, 단순한 함수(예: +)조차 표현이 어려움
      그래도 매우 흥미로운 발견임
    • 멋진 트릭이긴 하지만, 중대한 발견이라기엔 과장된 듯함
  • -x의 유도 과정이 잘못된 것 같음
    스택 머신 실행 추적을 보면, eml(z, eml(x,1)) = e^z - x 형태인데,
    이게 -x가 되려면 e^z = 0이어야 함. 하지만 그런 복소수 z는 존재하지 않음
    실제로 z를 전개하면 ln(0) 같은 문제가 생김. x^-1도 비슷함
    ln(0)=∞, x/∞=0 같은 가정을 하면 “그럴듯하게” 동작함

    • 저자가 RPN 표기법을 언급하지만, 공식은 이미지로만 제공해서 불편함
      계산 순서를 보면 ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞ 순으로 진행됨
    • 논문에서도 이 문제를 인정함. 내가 너무 빨리 판단했음
  • 흥미로운 아이디어 몇 가지가 떠오름

    1. 절댓값을 sqrt(x*x)로 추가하면 min, max, signum도 유도 가능함
    2. f(x)와 f⁻¹(x)가 eml()로 표현 가능한 전단사 함수라면, eml(f(x), f(y))와 f⁻¹(1)을 이용해 또 다른 보편적 기초를 만들 수 있음
    3. 자연로그 대신 2^x - log₂(y) 형태의 기초를 쓰면 계산적으로 더 효율적일 수도 있음. Elias omega coding을 떠올리게 함
    4. eml() 트리의 도함수 계산 알고리즘이 있다면, 어떤 함수가 기호적 부정적분을 가질 수 없는지 명확히 증명할 수 있을 듯함
    5. 복소수 영역 확장은 복소 진릿값 퍼지 논리와도 연결될 수 있음. Lukasiewicz와 곱셈 논리를 통합할 가능성 있음
  • 재미로 emlvm 프로젝트를 어제 만들어봄

  • “깊이 4 이하의 EML 트리로 폐형식 함수 복원이 가능함”이라는 부분이 정말 멋짐
    이런 게 가능할지 늘 궁금했음