12P by GN⁺ 4일전 | ★ favorite | 댓글 3개
  • 텍스트는 인류 역사상 가장 강력한 의사소통 기술로, 다른 모든 미디어를 압도하는 표현력과 효율성을 지님
  • 그림·영상·음성보다 추상적 개념과 복잡한 사고를 정밀하게 전달하는 데 가장 적합한 수단임
  • 수천 년 전 기록까지 읽을 수 있을 만큼 내구성과 안정성이 검증된 기술임
  • 저장·전송 비용 면에서 압도적으로 효율적이며, 통신 기술 발전의 출발점 역할을 반복해 왔음
  • 검색·번역·요약·협업 등 사회적 활용 범위와 깊이에서 다른 매체가 따라올 수 없음

텍스트에 대한 기본 입장

  • 비디오, 3D, 게임, 동적 멀티미디어 시스템에 대한 질문을 받을 때마다 동일한 입장을 반복해 왔음
  • 이미지, 사진, 영화, 음악의 가치를 부정하지 않으나, 텍스트의 우위는 절대적이라고 봄
  • 텍스트를 가장 강력하고 유용하며 효과적인 의사소통 기술로 규정함

가장 오래되고 안정적인 기술

  • 말과 수화는 인간 사회에 자연적으로 존재하지만, 텍스트는 학습과 전승을 통해 획득되는 기술
  • 약 5천 년 전의 기록도 현재 읽을 수 있을 정도로 시간을 견디는 내구성을 가짐
  • 돌과 같은 물리적 매체에 새겨져 인류보다 오래 남을 가능성도 지님

가장 유연한 표현 수단

  • 이미지는 특정 상황에서는 강력하지만, 임의의 추상 문장을 시각적으로 표현하는 것은 불가능
  • 인권 정의와 같은 개념적 문장은 그림으로 대체할 수 없음
  • 텍스트는 정밀도와 모호성의 수준을 통제하며 아이디어를 전달 가능함
  • 문학, 철학, 역사, 수학, 논리, 프로그래밍, 공학이 텍스트 기반인 것은 우연이 아님

가장 효율적인 통신 방식

  • 텍스트는 저장 공간과 전송 비용에서 차원이 다른 효율성을 가짐
  • 수천 바이트의 텍스트가 간단한 아이콘 이미지보다도 작을 수 있음
  • 광학 전신, 전기 전신, 텔레타이프, 초기 컴퓨터 네트워크까지 항상 텍스트가 먼저 등장
  • 음성·이미지·영상은 대역폭이 충분히 저렴해진 뒤에야 등장함
  • 위키피디아 전체를 스마트폰에 담을 수 있을 정도의 밀도를 가짐

사회적으로 가장 유용한 기술

  • 1:1, 1:N, M:N 소통 모두에서 효율적으로 작동
  • 수작업 포함 검색과 색인이 가능함
  • 번역, 비교, diff, 군집화, 교정, 요약, 필터링 등 알고리듬적 처리에 최적화
  • 비동기적 사용이 가능하고, 속도 조절이 자유로움
  • 공동 편집, 인용, 주석, 분기 토론, 요약, 리뷰, 2차 창작까지 지원함
  • 도서관과 인터넷 게시물 수준의 사회적·인지적 복잡성을 대체할 기술은 존재하지 않음

결론

  • 그래서 텍스트에 대한 입장은 분명함 : 언제나 텍스트를 먼저 선택해야 함 (always pick text first)
  • 예전 상사의 말을 빌리자면, 항상 텍스트에 걸어야 함 (always bet on text)
  • 어떤 일을 텍스트로 할 수 있다면 그렇게 해야 함. 텍스트는 거의 실망시키지 않음

텍스트가 정말 좋은 표현 도구인 건 맞고 매우 중요한 것도 맞긴 한데......
모든걸 다 텍스트로 저장할 수는 없죠.
텍스트는 결국에는 압축된 표현입니다. 우리가 느낄 수 있는 오감(시각,청각,촉각,미각,후각)에 대해서 사회적으로 합의된 형식으로 압축해서 표현하는 거죠.
그런데 그 원형이 되는 대상에 대한 정보가 없으면 아무리 텍스트로 데이터를 저장한다고 해도 나중에 그 원형이 된 대상을 모르는 경우에는 그 텍스트는 의미를 잃습니다.
우리가 카세트라는 걸 알고 있지만 과연 최근 태어난 어린아이들에게 카세트라는 텍스트만 보여주고 이게 뭔지 물어보면 과연 제대로 대답할 애들이 몇이나 될까요? 아무리 카세트의 형태와 기능, 동작 방식에 대해서 열심히 설명해 놓는다고 해도 수천년 쯤 뒤에 그 텍스트만 가지고 그 카세트라는 것을 완벽히 재현해낼 수 있을까요?
그런 경우에는 그보다는 카세트 사진 몇 장이나 도면, 카세트를 사용하는 동영상 몇 분이 더 유용할 수 있죠.

텍스트는 분명 안정적이지만, 직관적인지는 잘 모르겠습니다.

Hacker News 의견들
  • 나는 이 논의의 이분법이 이해되지 않음
    왜 내가 UTF-8과 피아노 연주 녹음 중 하나를 선택해야 하는 상황이 생기는지 모르겠음
    마치 주제에 흥분한 사람이 “Ford vs. Chevy”식의 단순 대립으로만 말하는 것처럼 느껴짐
    우리 모두 텍스트를 좋아하니, 굳이 설득하려 하지 말았으면 함

  • 나는 텍스트의 무한한 유연성과 내구성에는 동의하지만, Bret Victor의 작업을 보고 나서 텍스트의 한계를 느꼈음
    피아노를 배울 때는 즉각적인 피드백 루프가 있었는데, 이런 학습 방식은 텍스트로는 구현하기 어려움
    Victor의 핵심은 이런 피드백 중심의 학습을 공학이나 교육 전반에도 적용하자는 것임
    텍스트는 여전히 중요하지만, 다른 감각적 직관을 활용하는 방식에도 가능성이 많다고 생각함

    • 단기적으로는 텍스트보다 풍부한 매체를 구현하려면 엔지니어링 난이도가 훨씬 높음
      Bret Victor의 시연은 감동적이지만, 실제 구현에는 엄청난 노력이 필요함
      아이디어 자체는 훌륭하지만, 실현에는 큰 투자와 헌신이 필요하다는 점을 이해해야 함
    • 과학 분야에서 일하면 이 논점이 더 명확해짐
      데이터나 결과를 텍스트로 설명하는 건 어렵지만, 그래프는 단번에 많은 정보를 전달함
      텍스트는 비동기적이라 좋지만, 인간은 본능적으로 말하거나 시각적으로 표현하는 걸 선호함
      결국 단일한 커뮤니케이션 방식보다는 혼합적 접근이 더 자연스러움
    • 예를 들어, 전선 더미를 푸는 법을 텍스트로 설명하는 건 비효율적임
      아이는 그냥 보고 배우며, 물리적 직관으로 이해함
      자전거 타기처럼 몸으로 배우는 지식은 텍스트로는 거의 전달되지 않음
    • 나는 “항상 상징적 표현에 베팅하라”고 말하고 싶음
      텍스트는 상징적이고, 이미지는 감각적임
      Norman Rockwell의 그림을 텍스트로 완벽히 표현하기는 불가능함
      악보나 Feynman 다이어그램처럼 텍스트 기반의 상징 체계는 여전히 강력함
    • 이 논의 자체가 텍스트의 우월성을 보여줌
      나는 OP의 글을 30초 만에 요약했지만, Bret Victor의 영상은 54분짜리라 대부분은 보지 않을 것임
      텍스트는 효율성과 변환성에서 여전히 최적의 매체임
      다른 매체는 보조적 수단으로 활용하는 게 좋다고 생각함
  • 나는 스스로를 텍스트 극대주의자라고 부름
    텍스트는 인간과 기계의 자연스러운 접점이며, 효율성과 투명성의 균형점임
    모든 것은 문자열로 저장 가능하고, base64·JSON·HTML·CSS·SQL 등으로 표현 가능함
    결국 업계가 쫓던 은탄환(silver bullet) 은 문자열이었음
    복잡한 바이너리 포맷은 가독성을 잃고, GZIP 압축 후엔 이점도 거의 사라짐

    • 하지만 “효율성·유연성·투명성” 셋 다 얻을 수는 없음
      텍스트 기반 프로토콜은 Postel의 법칙 문제로 인해 불안정해짐
      30%의 대역폭 차이는 결코 작지 않으며, HTTP3가 바이너리로 전환한 이유도 그것임
      base64를 압축해도 이미 가독성은 잃은 상태임
      관련 참고: Robustness principle, Regex 문제, ReDoS
    • “역직렬화의 CPU 비용이 미미하다”는 주장에 대해, 반대로 “사람이 읽기 위해 툴을 쓰는 비용”도 미미함
      어차피 gzip된 JSON은 사람이 직접 읽을 수 없으니, 도구를 거치는 건 큰 문제 아님
    • 나는 매일 protobuf를 다루는데, 이 포맷의 바이너리 구조는 호환성 보장을 위한 것임
      사람이 다루는 설정 파일에는 text proto나 JSON이 더 적합함
    • 나는 문서 저장을 DOC나 PDF에서 Markdown 텍스트로 옮겼음
      grep, git, 변환 모두 쉬움
      옛날 논문은 Lotus Word Pro로 써서 지금은 읽을 수 없는데, 텍스트였다면 문제없었을 것임
    • protobuf의 텍스트 버전은 base64나 JSON이 아님
      대규모 시스템에서는 텍스트 파일이 많이 돌지만, 투명성은 거의 없음
      대규모 환경에서는 몇 비트 절약이 큰 비용 절감으로 이어지므로, self-labeled 필드는 배제됨
  • 텍스트는 결국 바이트의 표현일 뿐임
    하지만 텍스트에 집착하는 이유는 바이너리 포맷의 폐쇄성과 도구 부족 때문임
    CSV에 base64 열이 수백만 개 있어도, 적절한 도구가 없으면 바이너리보다 나을 게 없음

    • 텍스트는 단순히 바이트가 아니라 인간이 읽을 수 있는 기호 체계
    • 텍스트는 허용 가능한 바이트 시퀀스에 제약을 두고, 언어 진화의 압축 구조를 가짐
      표준화 덕분에 의미를 공유할 수 있고, LLM 같은 모델이 이를 학습할 수 있음
    • 농담이지만, 바이너리 통신으로 이루어진 문명도 있음 — Bynar 문명
  • “무작위 위키 문장을 그림으로 표현해보라”는 말처럼, 텍스트로 모든 걸 대체할 수 없음
    반대로 영화 클립을 텍스트로 완벽히 설명하는 것도 불가능함
    텍스트는 모든 매체의 상위집합이 아님, 단지 다른 종류의 표현일 뿐임

  • “텍스트는 가장 오래되고 안정적인 커뮤니케이션 기술”이라는 주장에 대해
    사실 언어 자체가 더 오래된 기술임
    구전 전통은 세대를 넘어 지식을 전달했고, 인간 언어는 그중 가장 복잡함
    예를 들어, 호주 원주민 Gunditjmara는 3만 년 전 화산 폭발을 이야기로 전함 (Budj Bim)
    텍스트는 세대를 넘어 정보 왜곡 없이 전달할 수 있다는 점에서 독특함
    결국 “언어에 베팅하라”는 결론임

    • 만약 생물학적 커뮤니케이션까지 포함한다면, RNA의 유전 부호가 가장 오래된 “텍스트”일 것임
    • Gunditjmara 사례는 매력적이지만, 검증 불가능한 추정에 불과함
  • LLM이 놀라운 이유는 인류가 수천 년간 모든 지식을 텍스트로 기록해왔기 때문임
    이미지 모델도 텍스트와 이미지의 공유 임베딩 공간 덕분에 발전했음

    • 하지만 LLM이 수십 번의 질의응답으로 원하는 답을 찾는 건 효율적이라기보다 탐색적
      편리하긴 하지만, 진정한 “효과적” 모델이라 부르긴 어려움
  • 나는 언어학자로서, 멸종 위기 언어를 기록할 때 텍스트(Unicode)가 가장 지속 가능한 포맷이라 믿음
    수천 년 전의 그리스어나 산스크리트 문법서도 여전히 읽을 수 있음
    우리 팀은 PDF로 출판했지만, 내부적으로는 XML로 보존했음
    2000년 후에도 읽히길 바람

    • 하지만 개인적으로는 10년 전 저장한 텍스트 파일이 오히려 열기 어려웠던 경험이 있음
      UTF-16, SJIS, EUC 등 인코딩 혼란이 많았고, 반면 PDF나 JPEG은 여전히 완벽히 열림
      저장 공간이 허락된다면 이미지 포맷으로 보관하는 게 더 안전하다고 느낌
      또한 Unicode로도 표현되지 않는 문자가 여전히 존재함
    • 음악 악보처럼, 어떤 표현은 텍스트냐 바이너리냐로 나눌 수 없음
      동굴 벽화는 텍스트보다 의도를 더 잘 전달함
  • Future Text Publishing 시리즈를 보면,
    “텍스트”는 본질적으로 2D 그림
    컴퓨터는 텍스트를 이해하지 못하고, 단지 숫자를 처리할 뿐임
    인간이 그 숫자에 의미를 부여해 기호와 언어 체계를 만든 것임
    DNA/RNA는 물리적으로 구성된 보편적 문자 체계의 예로 볼 수 있음

  • 이 글은 예전에도 여러 번 HN에 올라왔음
    2014년, 2015년, 2021년에도 각각 수백 개의 댓글이 달렸음
    2014 버전, 2015 버전, 2021 버전