GN⁺: 그레이트 테이블스의 디자인 철학
(posit-dev.github.io)테이블의 진정한 의미는 무엇인가?
- 테이블이란 데이터를 열과 행으로 표현하고 주로 텍스트로 구성된 데이터임.
- 간단한 테이블 예시를 통해 개인의 특성을 열과 행으로 배열한 것을 확인할 수 있음.
- 열의 순서와 레이블이 중요하며, 가독성을 높이기 위한 시각적 요소로 수평선을 사용하기도 함.
테이블의 초기 역사
- 테이블은 사각형 그리드에서 발전했으며, 인류 역사상 가장 초기의 그리드는 프랑스의 동굴 벽화에서 찾아볼 수 있음.
- 고대 그리스와 로마 시대에는 천문학적 및 지리적 위치를 나타내기 위해 그리드 시스템을 사용함.
- 농업이 확산되면서 경제 거래를 기록하고 관리할 필요성이 생겼고, 메소포타미아의 우루크에서 발견된 점토판에는 초기의 정교한 테이블이 새겨져 있음.
중세의 현대적 테이블
- 20세기 중반은 테이블 디자인에 있어 최고의 시기로, 정밀한 조판 기술과 타이프라이터, 오프셋 인쇄기 등의 기술이 결합되어 아름다운 테이블이 제작됨.
- 미국 인구조사국의 '테이블 제작 매뉴얼'은 정보가 풍부한 테이블의 이상적인 디자인에 대해 상세히 설명하고 있으며, 그 원칙들은 오늘날에도 여전히 유효함.
테이블의 후기 역사
- 1970년대와 1980년대에 컴퓨팅 기술이 접근하기 쉬워지면서 전자 및 인쇄 형태의 테이블 생성이 가능해짐.
- VisiCalc과 같은 스프레드시트 소프트웨어의 등장으로 컴퓨팅 테이블의 대중화가 시작됨.
- 시간이 지나면서 스프레드시트 내 테이블은 더욱 눈에 쉽게 들어오는 형태로 발전했으나, 여전히 인구조사국의 매뉴얼에 나온 테이블에는 미치지 못함.
Great Tables가 취하는 테이블 접근 방식
- Great Tables는 코딩 인터페이스의 힘을 통해 중세의 우아함을 복원함.
- 테이블을 여섯 가지 독립적인 구성 요소의 조합으로 표현하며, 이를 통해 테이블을 구조화하고 값의 형식을 지정하며 스타일을 적용할 수 있음.
- Great Tables는 테이블의 표시에 중점을 두고 있으며, 출판 및 발표를 위한 테이블 디스플레이에 초점을 맞춤.
결론
- 테이블은 오랜 역사를 거치며 발전해왔으며, Great Tables 패키지는 요약 테이블 생성에 유용함.
- 지속적인 연구와 커뮤니티의 피드백을 통해 API를 개선하고 있으며, 테이블의 질을 높이는 것을 목표로 함.
GN⁺의 의견
- Great Tables는 데이터 시각화의 중요한 측면인 테이블 생성을 위한 혁신적인 도구를 제공함으로써 데이터 과학자와 분석가들에게 큰 도움이 될 것임.
- 이 기술은 데이터의 가독성과 정보 전달의 효율성을 높이는 데 기여할 수 있으며, 이는 학술 연구나 비즈니스 보고서 작성에 특히 중요함.
- 그러나 사용자가 Python과 같은 프로그래밍 언어에 익숙하지 않다면, Great Tables의 사용이 어려울 수 있으므로 사용자 친화적인 인터페이스 개발이 필요할 수 있음.
- 비슷한 기능을 제공하는 다른 도구로는 Microsoft Excel, Google Sheets, Tableau 등이 있으나, Great Tables는 프로그래밍을 통한 더 세밀한 커스터마이징을 가능하게 함.
- 기술 도입 시 데이터 보안과 개인정보 보호를 고려해야 하며, 오픈소스 소프트웨어의 경우 커뮤니티 지원과 지속적인 업데이트가 중요한 요소임.
Hacker News 의견
-
Great Tables에 대한 평가
- Great Tables는 파이썬/주피터 테이블 작업에 있어 훌륭한 성과를 보임. 그들이 만들어가는 것은 그래픽의 문법과 유사한 "테이블의 문법" 같음.
- 다른 주피터 테이블 라이브러리인 buckaroo를 개발한 개인은, 대화형으로 다양한 형식과 후처리 기능을 순환하며 테이블에서 중요한 통찰을 빠르게 얻을 수 있도록 하는 것을 목표로 함.
- Great Tables는 수동으로 테이블을 포맷팅하여 프레젠테이션에 사용할 수 있도록 설계됨.
-
Great Table의 디자인에 대한 비평
- Great Table의 예시는 너무 복잡함. 제목의 상단과 하단 가로선이 불필요하고, 첫 번째 열과 정렬된 것이 아닌 두 번째 열과 정렬되어야 한다고 생각함.
- 행 라벨 배경이 너무 어둡고 글꼴이 읽기 어려움. 이탤릭체로 된 행 그룹 라벨("Name")도 마음에 들지 않음.
- 중앙에 떠 있는 스패너 라벨이 테이블을 스캔하기 어렵게 만듦. 왼쪽 정렬이 더 나을 것 같음.
- 폰트도 마음에 들지 않으며, 변경을 가한 테이블은 더 읽기 쉬움.
-
패키지에 대한 호평
- 몇 년 동안 R에서 사용해온 패키지를 좋아함. HTML에서 테이블을 만드는 데는 훌륭하지만 PDF와 DOCX 출력은 다소 덜 정교함.
- 파이썬 버전을 R 버전과 동등하게 만들려는 최근의 변화가 R 개발을 늦추는 것 같아 걱정되지만, 사용 언어에 상관없이 확인해볼 가치가 있음.
-
패키지에 대한 감탄
- 이 패키지는 놀라움을 자아냄. 데이터 테이블 프레젠테이션의 질이 점점 떨어지는 것을 보며 어떻게 이렇게 오랫동안 갔는지 의문이 듦.
- 데이터 분석에 다시 뛰어들고 싶은 흥미를 불러일으킴. API 개선과 확장 가능성도 보임.
-
관련 서적 및 AI 모델
- 수학적 테이블의 역사에 대한 책이 있음.
- AI 모델이 스프레드시트에서 "좋은 테이블"을 필요로 함. 예를 들어, 컬럼 이름, 헤더 등이 AI 모델이 맥락을 이해하는 데 중요함.
-
Great Tables 공동 유지 관리자의 의견
- Rich Iannone와 함께 Great Tables의 공동 유지 관리자 중 한 명임.
- Rich는 자신의 패키지 철학을 설명해달라는 요청에 테이블 디스플레이에 대한 5천 년 역사를 제공하는 유일한 소프트웨어 개발자임.
-
"nanoplots"에 대한 질문
- "nanoplots"는 본질적으로 스파크라인과 같지 않은가?
-
테이블의 활용도에 대한 의견
- 테이블은 비교를 할 때 간결하고 설명력이 있음에도 불구하고 충분히 활용되지 않음. 대부분의 텍스트 편집기는 좋은 디자인 선택으로 미리 구성된 테이블을 삽입하는 대신 빈 테이블로 시작함.
-
DocBook 테이블과 LaTeX에 대한 언급
- DocBook 테이블에는 여러 유형이 있으며, 사용한 유형은 GT의 구조를 일부 가지고 있음.
- 또한 LaTeX에 대한 언급이 있으며, 여기서는 "일반" 테이블과 한 페이지를 넘어가는 긴 테이블이 있음.
-
미드센추리 모던 테이블에 대한 관심
- 미드센추리 모던 테이블은 많은 수직선을 가지고 있어 관심이 있음. LaTeX에 대한 서브레딧에서는 수직선 하나라도 사용하는 것이 용납할 수 없는 실수로 여겨지는 경향이 있음.