# 항상 텍스트에 베팅하라 (2014)

> Clean Markdown view of GeekNews topic #25378. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=25378](https://news.hada.io/topic?id=25378)
- GeekNews Markdown: [https://news.hada.io/topic/25378.md](https://news.hada.io/topic/25378.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2025-12-28T01:33:09+09:00
- Updated: 2025-12-28T01:33:09+09:00
- Original source: [graydon2.dreamwidth.org](https://graydon2.dreamwidth.org/193447.html)
- Points: 14
- Comments: 3

## Summary

**텍스트는 인류가 만든 가장 오래되고 안정적인 기술**로, 수천 년의 시간을 넘어 여전히 지식을 전달하는 핵심 수단으로 작동합니다. 이미지나 영상이 감각을 자극한다면, 텍스트는 **추상적 사고와 정밀한 개념 전달**을 가능하게 합니다. 저장·전송 비용 면에서도 압도적으로 효율적이며, 검색·번역·협업 등 알고리즘적 처리에 최적화된 매체로서 오늘날의 디지털 커뮤니케이션 구조를 지탱하고 있습니다.

## Topic Body

- 텍스트는 **인류 역사상 가장 강력한 의사소통 기술**로, 다른 모든 미디어를 압도하는 표현력과 효율성을 지님  
- 그림·영상·음성보다 **추상적 개념과 복잡한 사고**를 정밀하게 전달하는 데 가장 적합한 수단임  
- 수천 년 전 기록까지 읽을 수 있을 만큼 **내구성과 안정성**이 검증된 기술임  
- 저장·전송 비용 면에서 **압도적으로 효율적**이며, 통신 기술 발전의 출발점 역할을 반복해 왔음  
- 검색·번역·요약·협업 등 **사회적 활용 범위와 깊이**에서 다른 매체가 따라올 수 없음  
  
---  
### 텍스트에 대한 기본 입장  
- 비디오, 3D, 게임, 동적 멀티미디어 시스템에 대한 질문을 받을 때마다 동일한 입장을 반복해 왔음  
- 이미지, 사진, 영화, 음악의 가치를 부정하지 않으나, **텍스트의 우위는 절대적**이라고 봄  
- 텍스트를 가장 강력하고 유용하며 효과적인 의사소통 기술로 규정함  
  
### 가장 오래되고 안정적인 기술  
- 말과 수화는 인간 사회에 자연적으로 존재하지만, **텍스트는 학습과 전승을 통해 획득되는 기술**임  
- 약 5천 년 전의 기록도 현재 읽을 수 있을 정도로 **시간을 견디는 내구성**을 가짐  
- 돌과 같은 물리적 매체에 새겨져 인류보다 오래 남을 가능성도 지님  
  
### 가장 유연한 표현 수단  
- 이미지는 특정 상황에서는 강력하지만, **임의의 추상 문장을 시각적으로 표현하는 것은 불가능**함  
- 인권 정의와 같은 개념적 문장은 그림으로 대체할 수 없음  
- 텍스트는 **정밀도와 모호성의 수준을 통제**하며 아이디어를 전달 가능함  
- 문학, 철학, 역사, 수학, 논리, 프로그래밍, 공학이 텍스트 기반인 것은 우연이 아님  
  
### 가장 효율적인 통신 방식  
- 텍스트는 저장 공간과 전송 비용에서 **차원이 다른 효율성**을 가짐  
- 수천 바이트의 텍스트가 간단한 아이콘 이미지보다도 작을 수 있음  
- 광학 전신, 전기 전신, 텔레타이프, 초기 컴퓨터 네트워크까지 **항상 텍스트가 먼저 등장**함  
- 음성·이미지·영상은 대역폭이 충분히 저렴해진 뒤에야 등장함  
- 위키피디아 전체를 스마트폰에 담을 수 있을 정도의 밀도를 가짐  
  
### 사회적으로 가장 유용한 기술  
- 1:1, 1:N, M:N 소통 모두에서 **효율적으로 작동**함  
- 수작업 포함 **검색과 색인**이 가능함  
- 번역, 비교, diff, 군집화, 교정, 요약, 필터링 등 **알고리듬적 처리에 최적화**됨  
- 비동기적 사용이 가능하고, 속도 조절이 자유로움  
- 공동 편집, 인용, 주석, 분기 토론, 요약, 리뷰, 2차 창작까지 지원함  
- 도서관과 인터넷 게시물 수준의 **사회적·인지적 복잡성**을 대체할 기술은 존재하지 않음  
  
### 결론  
  
- 그래서 텍스트에 대한 입장은 분명함 : 언제나 **텍스트를 먼저 선택해야 함 (always pick text first)**  
- 예전 상사의 말을 빌리자면, 항상 **텍스트에 걸어야 함 (always bet on text)**  
- **어떤 일을 텍스트로 할 수 있다면 그렇게 해야 함**. 텍스트는 거의 실망시키지 않음

## Comments



### Comment 48455

- Author: cronex
- Created: 2025-12-30T11:58:31+09:00
- Points: 2

텍스트가 정말 좋은 표현 도구인 건 맞고 매우 중요한 것도 맞긴 한데......   
모든걸 다 텍스트로 저장할 수는 없죠.   
텍스트는 결국에는 압축된 표현입니다. 우리가 느낄 수 있는 오감(시각,청각,촉각,미각,후각)에 대해서 사회적으로 합의된 형식으로 압축해서 표현하는 거죠.   
그런데 그 원형이 되는 대상에 대한 정보가 없으면 아무리 텍스트로 데이터를 저장한다고 해도 나중에 그 원형이 된 대상을 모르는 경우에는 그 텍스트는 의미를 잃습니다.   
우리가 카세트라는 걸 알고 있지만 과연 최근 태어난 어린아이들에게 카세트라는 텍스트만 보여주고 이게 뭔지 물어보면 과연 제대로 대답할 애들이 몇이나 될까요? 아무리 카세트의 형태와 기능, 동작 방식에 대해서 열심히 설명해 놓는다고 해도 수천년 쯤 뒤에 그 텍스트만 가지고 그 카세트라는 것을 완벽히 재현해낼 수 있을까요?   
그런 경우에는 그보다는 카세트 사진 몇 장이나 도면, 카세트를 사용하는 동영상 몇 분이 더 유용할 수 있죠.

### Comment 48355

- Author: roxie
- Created: 2025-12-29T01:44:28+09:00
- Points: 1

텍스트는 분명 안정적이지만, 직관적인지는 잘 모르겠습니다.

### Comment 48334

- Author: neo
- Created: 2025-12-28T01:33:09+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=46397379) 
- 나는 이 논의의 **이분법**이 이해되지 않음  
  왜 내가 UTF-8과 피아노 연주 녹음 중 하나를 선택해야 하는 상황이 생기는지 모르겠음  
  마치 주제에 흥분한 사람이 “Ford vs. Chevy”식의 단순 대립으로만 말하는 것처럼 느껴짐  
  우리 모두 텍스트를 좋아하니, 굳이 설득하려 하지 말았으면 함  

- 나는 텍스트의 **무한한 유연성**과 내구성에는 동의하지만, Bret Victor의 작업을 보고 나서 텍스트의 한계를 느꼈음  
  피아노를 배울 때는 즉각적인 피드백 루프가 있었는데, 이런 학습 방식은 텍스트로는 구현하기 어려움  
  Victor의 핵심은 이런 피드백 중심의 학습을 **공학이나 교육 전반**에도 적용하자는 것임  
  텍스트는 여전히 중요하지만, 다른 감각적 직관을 활용하는 방식에도 가능성이 많다고 생각함  
  - 단기적으로는 텍스트보다 풍부한 매체를 구현하려면 **엔지니어링 난이도**가 훨씬 높음  
    Bret Victor의 시연은 감동적이지만, 실제 구현에는 엄청난 노력이 필요함  
    아이디어 자체는 훌륭하지만, 실현에는 큰 투자와 헌신이 필요하다는 점을 이해해야 함  
  - 과학 분야에서 일하면 이 논점이 더 명확해짐  
    데이터나 결과를 텍스트로 설명하는 건 어렵지만, **그래프**는 단번에 많은 정보를 전달함  
    텍스트는 비동기적이라 좋지만, 인간은 본능적으로 말하거나 시각적으로 표현하는 걸 선호함  
    결국 단일한 커뮤니케이션 방식보다는 **혼합적 접근**이 더 자연스러움  
  - 예를 들어, 전선 더미를 푸는 법을 텍스트로 설명하는 건 비효율적임  
    아이는 그냥 보고 배우며, **물리적 직관**으로 이해함  
    자전거 타기처럼 몸으로 배우는 지식은 텍스트로는 거의 전달되지 않음  
  - 나는 “항상 **상징적 표현**에 베팅하라”고 말하고 싶음  
    텍스트는 상징적이고, 이미지는 감각적임  
    Norman Rockwell의 그림을 텍스트로 완벽히 표현하기는 불가능함  
    악보나 Feynman 다이어그램처럼 텍스트 기반의 상징 체계는 여전히 강력함  
  - 이 논의 자체가 텍스트의 우월성을 보여줌  
    나는 OP의 글을 30초 만에 요약했지만, Bret Victor의 영상은 54분짜리라 대부분은 보지 않을 것임  
    텍스트는 **효율성과 변환성**에서 여전히 최적의 매체임  
    다른 매체는 보조적 수단으로 활용하는 게 좋다고 생각함  

- 나는 스스로를 **텍스트 극대주의자**라고 부름  
  텍스트는 인간과 기계의 자연스러운 접점이며, 효율성과 투명성의 균형점임  
  모든 것은 문자열로 저장 가능하고, base64·JSON·HTML·CSS·SQL 등으로 표현 가능함  
  결국 업계가 쫓던 **은탄환(silver bullet)** 은 문자열이었음  
  복잡한 바이너리 포맷은 가독성을 잃고, GZIP 압축 후엔 이점도 거의 사라짐  
  - 하지만 “효율성·유연성·투명성” 셋 다 얻을 수는 없음  
    텍스트 기반 프로토콜은 **Postel의 법칙** 문제로 인해 불안정해짐  
    30%의 대역폭 차이는 결코 작지 않으며, HTTP3가 바이너리로 전환한 이유도 그것임  
    base64를 압축해도 이미 가독성은 잃은 상태임  
    관련 참고: [Robustness principle](https://en.wikipedia.org/wiki/Robustness_principle), [Regex 문제](https://blog.codinghorror.com/regular-expressions-now-you-have-two-problems/), [ReDoS](https://en.wikipedia.org/wiki/ReDoS)  
  - “역직렬화의 CPU 비용이 미미하다”는 주장에 대해, 반대로 “사람이 읽기 위해 툴을 쓰는 비용”도 미미함  
    어차피 gzip된 JSON은 사람이 직접 읽을 수 없으니, 도구를 거치는 건 큰 문제 아님  
  - 나는 매일 **protobuf**를 다루는데, 이 포맷의 바이너리 구조는 **호환성 보장**을 위한 것임  
    사람이 다루는 설정 파일에는 text proto나 JSON이 더 적합함  
  - 나는 문서 저장을 DOC나 PDF에서 **Markdown 텍스트**로 옮겼음  
    grep, git, 변환 모두 쉬움  
    옛날 논문은 Lotus Word Pro로 써서 지금은 읽을 수 없는데, 텍스트였다면 문제없었을 것임  
  - protobuf의 텍스트 버전은 base64나 JSON이 아님  
    대규모 시스템에서는 텍스트 파일이 많이 돌지만, **투명성**은 거의 없음  
    대규모 환경에서는 몇 비트 절약이 큰 비용 절감으로 이어지므로, self-labeled 필드는 배제됨  

- 텍스트는 결국 **바이트의 표현**일 뿐임  
  하지만 텍스트에 집착하는 이유는 바이너리 포맷의 폐쇄성과 도구 부족 때문임  
  CSV에 base64 열이 수백만 개 있어도, 적절한 도구가 없으면 바이너리보다 나을 게 없음  
  - 텍스트는 단순히 바이트가 아니라 **인간이 읽을 수 있는 기호 체계**임  
  - 텍스트는 허용 가능한 바이트 시퀀스에 제약을 두고, **언어 진화의 압축 구조**를 가짐  
    표준화 덕분에 의미를 공유할 수 있고, LLM 같은 모델이 이를 학습할 수 있음  
  - 농담이지만, **바이너리 통신으로 이루어진 문명**도 있음 — [Bynar 문명](https://memory-alpha.fandom.com/wiki/Bynar)  

- “무작위 위키 문장을 그림으로 표현해보라”는 말처럼, 텍스트로 모든 걸 대체할 수 없음  
  반대로 영화 클립을 텍스트로 완벽히 설명하는 것도 불가능함  
  **텍스트는 모든 매체의 상위집합이 아님**, 단지 다른 종류의 표현일 뿐임  
  - 하지만 항공 분야는 대부분 **텍스트 기반 상호작용**으로 운영됨  
    예: [Flight management system](https://en.wikipedia.org/wiki/Flight_management_system), [NOTAM](https://en.wikipedia.org/wiki/NOTAM)  

- “텍스트는 가장 오래되고 안정적인 커뮤니케이션 기술”이라는 주장에 대해  
  사실 **언어 자체**가 더 오래된 기술임  
  구전 전통은 세대를 넘어 지식을 전달했고, 인간 언어는 그중 가장 복잡함  
  예를 들어, 호주 원주민 **Gunditjmara**는 3만 년 전 화산 폭발을 이야기로 전함 ([Budj Bim](https://en.wikipedia.org/wiki/Budj_Bim))  
  텍스트는 세대를 넘어 정보 왜곡 없이 전달할 수 있다는 점에서 독특함  
  결국 “언어에 베팅하라”는 결론임  
  - 만약 생물학적 커뮤니케이션까지 포함한다면, **RNA의 유전 부호**가 가장 오래된 “텍스트”일 것임  
  - Gunditjmara 사례는 매력적이지만, **검증 불가능한 추정**에 불과함  

- LLM이 놀라운 이유는 인류가 수천 년간 **모든 지식을 텍스트로 기록**해왔기 때문임  
  이미지 모델도 텍스트와 이미지의 **공유 임베딩 공간** 덕분에 발전했음  
  - 하지만 LLM이 수십 번의 질의응답으로 원하는 답을 찾는 건 **효율적이라기보다 탐색적**임  
    편리하긴 하지만, 진정한 “효과적” 모델이라 부르긴 어려움  

- 나는 **언어학자**로서, 멸종 위기 언어를 기록할 때 텍스트(Unicode)가 가장 **지속 가능한 포맷**이라 믿음  
  수천 년 전의 그리스어나 산스크리트 문법서도 여전히 읽을 수 있음  
  우리 팀은 PDF로 출판했지만, 내부적으로는 XML로 보존했음  
  2000년 후에도 읽히길 바람  
  - 하지만 개인적으로는 10년 전 저장한 **텍스트 파일이 오히려 열기 어려웠던 경험**이 있음  
    UTF-16, SJIS, EUC 등 인코딩 혼란이 많았고, 반면 PDF나 JPEG은 여전히 완벽히 열림  
    저장 공간이 허락된다면 **이미지 포맷**으로 보관하는 게 더 안전하다고 느낌  
    또한 Unicode로도 표현되지 않는 문자가 여전히 존재함  
  - 음악 악보처럼, 어떤 표현은 텍스트냐 바이너리냐로 나눌 수 없음  
    **동굴 벽화**는 텍스트보다 의도를 더 잘 전달함  

- [Future Text Publishing](https://futuretextpublishing.com/) 시리즈를 보면,  
  “텍스트”는 본질적으로 **2D 그림**임  
  컴퓨터는 텍스트를 이해하지 못하고, 단지 숫자를 처리할 뿐임  
  인간이 그 숫자에 의미를 부여해 **기호와 언어 체계**를 만든 것임  
  DNA/RNA는 물리적으로 구성된 **보편적 문자 체계**의 예로 볼 수 있음  

- 이 글은 예전에도 여러 번 HN에 올라왔음  
  2014년, 2015년, 2021년에도 각각 수백 개의 댓글이 달렸음  
  [2014 버전](https://news.ycombinator.com/item?id=8451271), [2015 버전](https://news.ycombinator.com/item?id=10284202), [2021 버전](https://news.ycombinator.com/item?id=26164001)
