# DNA는 약 60~750MB 정도의 데이터일 수 있다

> Clean Markdown view of GeekNews topic #20788. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=20788](https://news.hada.io/topic?id=20788)
- GeekNews Markdown: [https://news.hada.io/topic/20788.md](https://news.hada.io/topic/20788.md)
- Type: news
- Author: [baeba](https://news.hada.io/@baeba)
- Published: 2025-05-09T09:46:30+09:00
- Updated: 2025-05-09T09:46:30+09:00
- Original source: [dynomight.net](https://dynomight.net/dna/)
- Points: 6
- Comments: 0

## Summary

- **인간 DNA**에는 약 12억 비트 저장이 가능하지만, 반복과 유사 염색체로 인해 실제 **정보량**은 더 적게 평가됩니다.  
- DNA 정보는 **Kolmogorov 복잡도** 또는 **Shannon 정보량**과 같은 정보 이론적 개념으로 분석할 수 있으며, 공통 유전정보를 포함하는 Kolmogorov 접근이 더 유용하다고 설명합니다.  
- 전체 DNA 중 약 **1%만이 단백질**을 만들며, 나머지는 조절이나 아직 알려지지 않은 기능을 담당합니다.  
- 실제 인간을 생성할 수 있는 최소 **압축된 DNA**는 약 **60MB~750MB로** 추정되지만, 이는 명확히 정해진 값이 아니라고 평가합니다.

## Topic Body

**On counting**  
  
* 인간 DNA는 약 12억 비트를 저장할 수 있으며, 이는 약 1.5GB 정도의 정보량이다.  
* 하지만 DNA는 반복되는 부분이 많고, 부모로부터 받은 염색체가 유사하기 때문에 실제 정보량은 다르게 볼 수 있다.  
* 단순한 저장 공간 개념보다 더 정교한 정보 개념이 필요하다.  
  
**On compression**  
  
* 정보 이론에 따르면, 문자열의 정보는 압축 가능한 최소 길이로 정의할 수 있다.  
* DNA는 기준 유전체를 활용하면 99%까지 압축되기도 하지만, 이는 변이 부분만을 정보로 간주하는 특수한 경우다.  
* 기준 없이 압축할 경우 최대 62%까지 줄일 수 있으며, 이는 더 보편적인 정보량으로 볼 수 있다.  
  
**On information**  
  
* 정보량은 Kolmogorov 복잡도(압축 가능성) 또는 Shannon 정보량(확률 기반)으로 정의된다.  
* Kolmogorov는 절대적 정보량을, Shannon은 상대적 패턴을 기준으로 한다.  
* DNA는 이 두 관점 모두에서 의미가 있으나, 공통 유전정보를 포함하는 Kolmogorov 쪽이 유용하다고 본다.  
  
**On biology**  
  
* DNA의 1%만이 실제로 단백질로 변환되는 엑손이며, 나머지는 조절 기능 또는 미지의 기능을 갖는다.  
* 전사와 번역, 스플라이싱 등 복잡한 과정을 통해 단백질이 생성된다.  
* 다양한 RNA와 유전자 조절 요소들이 상호작용하며, DNA는 단순한 코드 이상이다.  
  
**On messiness**  
  
* DNA는 복잡하고 혼란스러운 구조를 가지고 있으며, 이는 돌연변이와 진화의 결과다.  
* 많은 DNA가 반복되거나 비활성 상태이며, 전이인자와 돌연변이 복구 기작이 이를 설명한다.  
* 생물은 오류에 강인하게 설계되어 있으며, 진화는 비효율조차 활용하는 방식으로 작동해왔다.  
  
**On information again**  
  
* “표현형 Kolmogorov 복잡도”를 제안하며, 인간으로 기능할 수 있는 최소 DNA 압축 크기를 정보량으로 본다.  
* 이는 기능적으로 동일한 인간을 생성할 수 있는 가장 짧은 DNA로 측정하는 방법이다.  
* 대략 60MB\~750MB로 추정되지만, 이는 현재로선 명확히 알 수 없는 값이다.

## Comments



_No public comments on this page._
