논제로섬 게임

▲

GN⁺ 4달전 | parent | ★ favorite | on: 논제로섬 게임(nonzerosum.games)

Hacker News 의견들

게임 이론에서 항상 아쉽다고 느낀 점은 신뢰를 수학적으로 모델링하는 틀이 부족하다는 점임
만약 의사결정 과정에 ‘제공(offering)’ 개념을 추가한다면, 신뢰를 측정하고 쌓아가며 장기적으로 무한 보상을 극대화할 수 있을 것 같음
예를 들어, 상대방을 얼마나 신뢰하는지와 그 신뢰를 얼마나 더 키우고 싶은지를 기준으로 선택을 함
처음에는 내가 약간 손해를 보더라도 상대에게 더 주는 선택을 하여 신뢰를 쌓고, 상대가 보답하면 다음엔 더 큰 제공을 함
그렇지 않으면 손해는 없고, 다음 제공을 줄이면 됨
결국 이는 ‘tit for tat’ 전략의 확장판으로, 최소-최대 해법이 아닌 최적의 장기 협력 정책을 찾는 과정임
수학적으로 정식화하면 구체적인 제공량을 계산할 수도 있을 것 같음
- Shapley value 같은 공정한 이익 분배 방식을 이용하면, 각 참가자가 공정하게 행동할 때 서로의 기대값을 극대화하는 협력 확률을 계산할 수 있음
  예를 들어 Ultimatum game에서는 N달러를 나눌 때 N/2가 공정한 분배이고, 상대의 기대값을 극대화하려면 그 금액을 제시해야 함
  신뢰는 결국 “내가 공정하게 행동할 것임을 명확히 설명하고, 상대도 그걸 이해할 것이라 가정하는 것”에서 생김
  더 복잡한 문제(예: 일회성 죄수의 딜레마)는 이 논문처럼 상대의 행동을 직접 증명하는 방식으로 접근할 수 있음
  인간에게는 어렵지만 인공지능 에이전트에는 가능성이 있음
- 실제로 반복 게임에서의 평판 효과(reputation effects) 연구가 존재함
  “reputation effects in repeated games”로 검색하면 대학 강의나 논문에서 관련 내용을 찾을 수 있음
  또한 신호 이론(signaling theory) , 특히 진화생물학에서의 신호 전달 모델도 느슨하게 연관됨
- 이 개념은 TCP의 혼잡 제어 알고리즘, 특히 ‘slow start’와 유사함
  네트워크가 최적 대역폭을 찾듯, 상대가 얼마나 보답할지를 점진적으로 탐색하는 과정임
  실제로 우리가 지금 통신하는 인터넷도 이 알고리즘 위에서 작동 중임
  TCP congestion control 참고
- 협동 게임 이론(cooperative game theory) 을 살펴보면, 신뢰는 정보 교환과 상대의 다음 행동 확률에 영향을 주는 요소로 모델링됨
- 혹시 기존의 tit for tat 전략이 부족한 구체적 사례가 있는지 궁금함
블로그의 스타일과 내용이 모두 마음에 듦
다만 각주를 읽을 때 스크롤을 위아래로 이동해야 하는 점이 불편함
각주에서 원문으로 돌아가는 링크나, hover 시 바로 표시되는 각주 기능이 있으면 좋겠음
예시 페이지 참고
사이트 디자인이 정말 잘 되어 있고, 글 내용도 흥미로움
- 하지만 개인적으로는 글씨체와 크기가 읽기 어렵고, 스크롤 시 애니메이션이 산만하게 느껴졌음
  배경색도 어두워서 흰색 텍스트가 너무 튀는 느낌임
  의도는 이해하지만, 구현된 형태는 “잘 만든 사이트”라기엔 조금 아쉬움
3D 테트리스 아이디어가 정말 기발함
- 나도 그 연출이 마음에 들었음. 다만 ‘남은 블록이 아래로 떨어지는’ 부분은 아직 판단이 서지 않음
  혹시 Blockout이라는 고전 게임을 알고 있다면 흥미로울 것임
사이트 전반이 멋지지만 RSS 피드가 깨져 있음
아마도 누락되거나 잘못된 문자가 원인일 듯함
- RSS 링크를 클릭하면 클립보드에 복사되도록 되어 있음
“Effortocracy” 글이 인상적이었음
글 말미의 요지는, 공로주의(meritocracy) 가 성취만을 기준으로 한다면, 그것을 노력 중심의 도덕적 가치 판단과 혼동하지 말아야 한다는 것임
관련 서적으로 Michael Sandel의 The Tyranny of Merit이 언급됨
원문 링크
- 나는 ‘노력주의’ 자체를 목표로 삼는 건 원치 않음
  무의미한 노력에 보상을 주는 건 성취를 해치는 일임
- 공로주의에 대한 두 가지 오해가 있음
  1. 공로(성과를 낼 능력)와 노력을 혼동함
  2. 공로주의가 도덕적 가치를 포함한다고 착각함
    사실 공로주의는 보상의 공정한 분배를 위한 의사결정 원리임
    협업이 모두에게 positive-sum이 되려면, 각자의 보상이 최소한 다른 선택지(다른 그룹 참여나 비참여)보다 커야 함
- 반대로 그 글은 비현실적이라고 느낌
  노력은 객관적으로 측정하기 어렵고, 실제로는 인간의 편향이 개입된 평가로 변질됨
  예를 들어 대학 입시에서 SAT 대신 에세이·배경을 평가하는 방식은 공정하지 않음
  성취 기반 평가가 완벽하진 않지만, 노력 측정 기반 시스템은 더 불공정하고 비효율적임
게임 이론이라는 단어만 봐도 흥미가 생김
앞으로 더 많은 글을 읽어보고 싶음
글이 약간 읽기 어렵지만, 자본주의를 비제로섬 게임으로 본 시각이 흥미로웠음
- 하지만 나는 자본주의가 완전한 제로섬 게임이라고 생각함
  자원 추출과 오염 같은 외부효과(externalities) 가 고려되지 않기 때문임
  지구의 자원은 유한하며, 그 분배 속도와 비효율성까지 고려하면 결국 제로섬 현실에 가까움
James가 제로섬 사고방식이 아닌 것은 다행임
그렇지 않았다면 어딘가에 ‘이기적인 쌍둥이’가 존재했을지도 모름