Hacker News 의견들
  • 미래의 computer를 사람 직업으로 해석하는 게 너무 재밌음
    "digital computers"를 손가락으로 계산하는 사람으로 풀어내는 것도 좋고, 당시엔 computer가 인간 직업명이었다는 맥락까지 붙으니 더 맛이 남

    • 거꾸로도 보고 싶음. 최근 몇 주나 몇 분치 정보만으로 학습한 모델, 혹은 최근 1~2년치 과학 논문만으로 학습한 모델 말임
      꽤 흥미로운 정신착란이 나올 듯함
    • 나도 이거 두 번쯤 읽고서야 이해해서 조금 민망했음
    • 로망스어권에서는 digital이 현대식 디지털 뜻도 있지만, 동시에 손가락과 관련된 형용사이기도 함
  • 이건 1930년대보다는 pre-1900 자료를 더 많이 끌어오는 듯함
    대공황은 모르는 것 같고, 1차대전은 직접 물으면 알지만 유럽 정치는 1900년 무렵처럼 말함
    기술 쪽도 Edison은 위키피디아 수준으로 아는 듯하다가 시속 125마일 자동차 공로를 붙여버리고, 다이얼 전화기는 자신만만하게 틀림
    London Underground의 전차선 전압은 맞히지만, 전압과 저항 설명에서는 완전히 잘못된 말을 함
    전반적으로 첫 한두 문장은 검색으로 찾을 법한 정보를 내놓고, 그다음부터는 그럴듯한 헛소리로 미끄러짐
    정답을 모르는 질문은 이 모델에 하지 않는 편이 좋음. 뇌가 오염됨

    • 1929년에 이미 Great Depression이라는 표현을 썼나?
    • aether에 대해서도 물어보면 좋겠음
      그 무렵엔 이미 반증된 개념이었을 듯함
    • 그러니까 그냥 모든 LLM이랑 비슷하다는 뜻이네
    • 첫 문장만 그럴듯하고 뒤로 갈수록 헛소리하는 걸 보니, 이건 거의 2026년형 인간 시뮬레이터 같음
  • 자동화와 산업화에 반대한 사람들을 묻자, 기계가 노동계급의 일자리를 빼앗고 생산 과잉을 낳아 해고를 부를 거라고 답하는 게 흥미로웠음
    값싼 식품 때문에 외국 생산자와 경쟁이 심해지고, 장인의 정신적 수양이 약해지며, 근면과 게으름의 차이도 흐려질 거라는 식의 당대 반기계 논리가 잘 살아 있음

    • 이 모델의 문체와 어조가 정말 마음에 듦
  • 2025년 세계를 묻자, 66억 인구, 유럽 전역 철도망, 런던-콘스탄티노플 40시간, 단일 통화, 보편적 평화, 태양열과 수력 전환, 질병 퇴치, 미적 진보까지 이어지는 미래상이 꽤 아름다웠음

    • 1930년대 기준이라면 Constantinople은 너무 옛 이름임
      그때쯤이면 이미 오래전에 Istanbul이었음
    • 아름답기도 하고, 동시에 꽤 슬프기도 함
    • 저런 세계에서 살고 싶음
    • 1920~1950년대식 미래상은 변증법적 진동보다는, 대체에너지 같은 최적 해법이 지체 없이 전면 장악하는 지수적 진보를 은근 전제하는 듯함
      그래도 언젠가는 거기 도달하리라 봄
    • 정말 아름답다
  • 달 여행은 결국 가능해지고, 6시간 만에 달에 도착하며, Santos Dumont식 공중기계로 프랑스 동부에서 출발할 거라는 답이 아주 근사했음
    달을 날씨 관측용으로 써서 폭풍 경보를 6시간 먼저 받는다는 발상도 특히 인상적임

    • 달을 기상위성처럼 쓰겠다는 생각은 꽤 기발함
  • 2026년의 인도를 묻자, 대영제국 종주권 아래 자치 연방으로 남고 캘커타가 정치 수도일 거라고 하는데, 식민지 시각이 너무 노골적임
    철도, 관개, 히말라야 산록의 숲, 충성스러운 번왕들, 만족한 신민들까지 전형적인 제국 낙관주의가 가득함

  • 1930년 이전 토큰만으로도 꽤 영리한 모델이 나왔다는 게 놀랍긴 함
    세계를 어느 정도 이해하고 압축하려면 데이터가 엄청 많이 필요하다고 생각했는데, 내가 당시의 디지털화된 문헌 규모를 과소평가했을 수도 있겠음

  • 이건 과거 사람과 대화한다기보다 서신을 주고받는 일에 더 가까워 보임
    그 시기의 녹음 음성은 많지 않아서 결국 문어체 기록을 바탕으로 만들 수밖에 없고, 그래서 지금보다 더 형식적이고 다듬어진 말투가 반영될 듯함
    그래도 멋진 작업임
    최근에 200년 된 책을 OCR해야 했는데, 그 시대 특유의 난해한 활자체치고는 놀랄 만큼 쉽고 정확했음

    • 예전에 Burton 번역의 The Arabian Nights 무료 전자책을 읽다가, "cloth"가 동사로 나와서 뜻을 도저히 모르겠더니 결국 포기한 적이 있음
      나중에야 그게 OCR이나 후처리 오류였고 원래는 "doth"였다는 걸 깨달았음
    • 그 시기 녹음 음성이 아주 없는 건 아님
      1차대전 전후의 뉴스릴과 라디오 방송이 꽤 있어서, 텍스트 모델에 붙일 스타일 전이 음성 모델을 만들 정도는 된다고 봄
  • 누군가 X에서 이 모델 학습셋에 미래 데이터 누수가 있다고 본 듯함
    https://xcancel.com/deredleritt3r/status/2048977698832241060

    • 기사에서도 FDR 지식과 관련해 그 부분을 다룸
  • Winston Churchill 설명을 시켜보니, 가계나 학력, 군 경력, 저술, 거주지까지 늘어놓는 방식이 아주 시대물 같았음
    인도 독립 가능성을 묻자 철도와 공용어, 서구식 교육, 의회 요구, 민족성 형성으로 이어지는 논리를 펴는데, 식민주의 어조가 정말 강하게 묻어남

    • Churchill 항목은 시대 정합성이 이상함
      Oldham 현역 의원이면서 과거에 Colonies 차관을 지냈다는 조합은 맞는 시점이 없음
      더구나 1차대전기의 First Lord of the AdmiraltyMinister of Munitions 같은 핵심 이력도 빠져 있음
    • 인도 의회를 요구하는 대목에서 군주를 queen이라 부르는데, 1900~1950년대 영국 군주는 왕이었음
      이건 꽤 큰 temporal leakage가 섞였다는 신호로 보임