GPT-5.2가 이론물리학에서 새로운 결과를 도출
(openai.com)- GPT‑5.2가 강한 핵력의 매개입자인 글루온 산란 진폭에 대한 새로운 공식을 제안했고, 이후 OpenAI 내부 모델과 연구진이 이를 증명 및 검증함
- 기존에는 특정 헬리시티 조합의 글루온 상호작용이 발생하지 않는다고 여겨졌으나, 연구는 특정 운동량 조건(half-collinear 영역) 에서 비영(zero가 아님)임을 확인
- GPT‑5.2 Pro가 복잡한 Feynman 다이어그램 계산식을 단순화하고, 일반화 가능한 패턴과 공식을 도출함
- 내부 scaffolded GPT‑5.2가 약 12시간의 추론 끝에 동일한 공식을 독립적으로 도출하고 형식적 증명을 완성함
- 이 연구는 AI와 인간 연구자의 협업이 이론물리학의 새로운 지식을 창출할 수 있음을 보여주는 사례로 평가됨
GPT‑5.2가 제안한 새로운 글루온 진폭 공식
- 새로운 preprint 논문에서 GPT‑5.2가 글루온 산란 진폭에 대한 공식을 제안, 이후 OpenAI 내부 모델과 연구진이 이를 증명 및 검증함
- 논문 제목은 “Single-minus gluon tree amplitudes are nonzero”
- 논문은 arXiv에 공개되었으며, 학술지 게재를 준비 중임
- 연구는 강한 핵력의 매개입자 글루온을 다루며, 특정 입자 상호작용이 발생하지 않는다는 기존 예상을 뒤집음
- 기존에는 한 개의 음의 헬리시티 글루온과 나머지 양의 헬리시티 글루온 조합의 경우 트리 수준 진폭이 0이라고 여겨졌음
- 그러나 연구진은 half-collinear 운동량 영역에서 이 진폭이 0이 아님을 계산함
half-collinear 영역에서의 새로운 발견
- 기존 주장은 입자 운동량이 일반적인 방향과 에너지를 가진다는 가정에 기반함
- 연구진은 이 가정이 적용되지 않는 특정 운동량 공간의 슬라이스를 식별함
- half-collinear는 글루온 운동량이 특정 정렬 조건을 만족하는 경우를 의미하며, 수학적으로 일관된 정의를 가짐
- 이 영역에서 진폭이 사라지지 않음을 계산하고, 특수한 운동학적 조건에서 그 값을 구함
- 이 결과는 향후 중력자(graviton) 진폭 계산 등으로 확장될 예정임
GPT‑5.2의 역할과 계산 과정
- GPT‑5.2 Pro가 먼저 Eq.(39) 의 형태로 공식을 추론함
- 인간 연구진은 작은 n 값에 대해 손으로 계산한 복잡한 식(Eq.29–32)을 제시함
- GPT‑5.2 Pro는 이를 단순화해 간결한 형태(Eq.35–38) 로 변환하고, 일반화 가능한 패턴을 발견함
- 내부 scaffolded GPT‑5.2가 약 12시간 동안 독립적으로 동일한 공식을 도출하고 형식적 증명을 완성함
- 이 공식은 Berends–Giele 재귀 관계를 만족함이 분석적으로 검증됨
- 또한 soft theorem 검증을 통해 입자가 ‘soft’해질 때의 거동과 일치함을 확인함
연구 확장과 향후 전망
- GPT‑5.2의 도움으로 글루온 진폭 계산이 중력자 진폭으로 확장됨
- 추가적인 일반화 연구가 진행 중이며, 향후 다른 AI 보조 연구 결과도 보고될 예정임
- 이 연구는 AI가 이론물리학의 새로운 수학적 구조를 발견하는 데 실질적으로 기여할 수 있음을 보여줌
물리학자들의 평가
-
Nima Arkani-Hamed(Institute for Advanced Study)는 복잡한 계산식이 단순한 형태로 정리되는 현상을 강조하며,
단순한 공식이 새로운 물리 구조를 발견하는 출발점이 될 수 있다고 언급함- 그는 이러한 단순화 과정이 컴퓨터에 의해 자동화될 수 있음을 오래전부터 기대해 왔다고 밝힘
-
Nathaniel Craig(UC Santa Barbara)는 이번 연구를 “이론물리학의 최전선을 확장하는 학술 수준의 연구”로 평가함
- GPT‑5.2와 인간 연구자의 협업이 새로운 과학적 통찰을 검증 가능한 형태로 생산했음을 강조함
- 물리학자와 LLM 간의 대화가 근본적으로 새로운 지식 창출로 이어질 수 있음을 확인함
Hacker News 의견들
-
기사 제목만 보면 마치 AI가 물리학의 새로운 결과를 스스로 발견한 것처럼 보이지만, 실제로는 인간이 문제를 설정했고 GPT가 복잡한 식을 단순화해 해결책을 찾은 것임
- GPT Pro가 이 작업을 12시간 동안 수행했으며, 내 경험상 LLM은 기존 요소들의 선형 결합으로 새로운 것을 만들 수 있지만 완전히 새로운 영역의 창조는 아직 어려움
- 인간이 n=6까지 복잡한 Feynman diagram을 계산했지만 일반식을 찾지 못했던 문제를 GPT가 단순화하고 일반화한 것임
- 다만 이런 결과는 이미 1986년에 유사하게 연구된 바 있음
- 연구진이 Guevara, Lupsasca, Skinner, Strominger 등 저명한 물리학자들이라 일반 사용자가 프롬프트로 재현하기는 어려움
- “기존 것들의 조합”과 “first principles”의 차이가 모호하다는 의견도 있으며, 인간조차 완전히 새로운 발견을 하는 경우는 드묾
- 체스 엔진의 발전 단계를 예로 들어, LLM도 결국 인간을 능가하는 Stage 4에 도달할 것이라는 전망이 있음
-
AI의 새로운 돌파구가 나올 때마다 “이건 진짜 혁신이 아니다”라며 폄하하는 사람들이 많음
- 예를 들어 GPT‑5.2가 Erdős 문제를 푼 사례에서도, 일부는 Fields 메달리스트 Terence Tao보다 더 잘 안다고 주장함
- 반대로, 이런 결과들이 과장되어 있다는 지적도 있음 — 실제로는 기존 논문이나 Aristotle 같은 비‑AI 도구의 도움을 받았다는 것임
- 혁신이 임박했다는 과도한 AI hype도 문제이며, 객관적 분석이 필요함
- 또 다른 시각에서는, 경영진이 이런 성과를 AI 의무화나 해고 정당화에 이용하면서 부정적 인식이 커진다고 함
- 많은 사람들이 자신의 커리어가 위협받는다는 불안감 때문에 방어적으로 반응한다는 의견도 있음
- “AI가 통찰을 얻었다”고 하기보다, 실제로는 인간이 방향을 제시하고 AI가 계산을 수행한 경우가 많음
- 결과가 과장된 경우가 많으며, 실제로는 수식 단순화와 일반화 수준이라는 분석도 있음
-
GPT‑5.2가 12시간 동안 문제를 추론해 공식과 증명을 도출했다는 점이 인상적임
- 개인적으로 GPT‑5.2 Thinking Extended를 써보면 오랜 시간 동안 일관된 수학적 사고를 유지할 수 있다는 인상을 받았음
- 5.3 버전과 codex CLI는 상태 관리와 컨텍스트 유지가 매우 뛰어나며, 장시간 실행을 위한 내부 압축 알고리즘이 있을 것으로 추정됨
- 30분 제한 이후에도 수동으로 다시 요청해 작업을 이어갈 수 있음
-
AI는 숙련된 사람에게 생산성 배가 도구가 될 수 있음
- Anthropic의 C 컴파일러 사례처럼, 인간이 문제를 정의하고 테스트를 설계하며 AI가 반복 작업을 수행하는 구조임
- “AI가 인간을 대체한다”는 서사는 관심과 자금 유치용 마케팅에 가깝고, 실제 연구자들의 노력을 가린다는 비판이 있음
- 그러나 팀 단위로 일하던 인력이 한 명과 AI로 대체된다면 여전히 90%의 일자리 손실이 발생한다는 현실적 우려도 있음
- 현재는 인간이 문제 정의나 검증의 마지막 10% 를 담당하지만, 언젠가는 그마저도 대체될 수 있음
- 일부는 결과가 과장되었다며 회의적이고, 실제 성능은 미디어 보도보다 훨씬 미흡했다고 평가함
- “생산성 배가”라는 표현이지만 실제로는 [0;1) 범위의 배수에 불과하다는 냉소적 의견도 있음
-
GPT‑5.2가 새로운 물리학 결과를 “단독으로” 도출했다기보다, 인간과 협업해 일반화된 공식을 증명한 것에 가까움
- 논문을 보면 GPT의 기여는 충분히 저자 자격이 있지만, 제목만 보면 과장된 인상을 줌
-
이전에도 ChatGPT가 Erdős 문제를 풀었다는 주장이 있었지만, 검증이 부족했음
- 실제로 OpenAI는 그런 주장을 하지 않았고, 일부 문제에서는 LLM이 독창적 기여를 한 사례가 있음
- Lean 같은 형식 검증 도구와의 결합은 여전히 인상적임
- 이번 연구는 단순한 마케팅이 아니라 실제 물리학자들이 참여한 진지한 시도임
-
인간의 “통찰”도 결국 기존 요소의 새로운 조합일 뿐이라는 주장임
- 예를 들어 눈 + 막대 + 청소 필요 = 눈삽, 눈삽 + 언덕 + 재미 욕구 = 썰매처럼, 창의성은 조합의 결과라는 설명임
- 과거에는 선형 프로그램으로는 “진짜 예술”을 만들 수 없다고 했지만 지금은 가능함
- 인간의 창의성을 지키려는 의지는 강하지만, 증거는 약함
- 어떤 사람들은 인간의 존재 가치를 도덕적으로 옹호하지만, AI가 모든 영역에서 인간을 능가하더라도 인간의 존재 자체의 가치를 인정해야 한다는 철학적 의견도 있음
-
제목이 오해를 불러일으킴 — 실제로는 GPT‑5.2가 물리학자들이 이미 추측한 공식을 일반화한 것에 불과하며, 물리학 자체의 새로운 발견은 아님
-
실제 연구에서는 인간이 문제를 정의하고, 기초 계산을 수행하며, 결과를 검증했음
- GPT는 단지 공식 리팩터링을 수행했을 뿐이며, 이는 물리학자라기보다 컴파일러의 역할에 가까움
- 과장된 과학 헤드라인은 자제해야 함
-
인상적인 결과이지만, 앞으로는 AI가 생성한 과학적 주장에 대해 검증과 감사 체계가 필수적임
- 어떤 데이터와 추론 과정을 거쳤는지, 재현 가능성이 있는지 명확히 해야 하며, 이를 위한 연구 도구가 필요함