DNA는 약 60~750MB 정도의 데이터일 수 있다
(dynomight.net)On counting
- 인간 DNA는 약 12억 비트를 저장할 수 있으며, 이는 약 1.5GB 정도의 정보량이다.
- 하지만 DNA는 반복되는 부분이 많고, 부모로부터 받은 염색체가 유사하기 때문에 실제 정보량은 다르게 볼 수 있다.
- 단순한 저장 공간 개념보다 더 정교한 정보 개념이 필요하다.
On compression
- 정보 이론에 따르면, 문자열의 정보는 압축 가능한 최소 길이로 정의할 수 있다.
- DNA는 기준 유전체를 활용하면 99%까지 압축되기도 하지만, 이는 변이 부분만을 정보로 간주하는 특수한 경우다.
- 기준 없이 압축할 경우 최대 62%까지 줄일 수 있으며, 이는 더 보편적인 정보량으로 볼 수 있다.
On information
- 정보량은 Kolmogorov 복잡도(압축 가능성) 또는 Shannon 정보량(확률 기반)으로 정의된다.
- Kolmogorov는 절대적 정보량을, Shannon은 상대적 패턴을 기준으로 한다.
- DNA는 이 두 관점 모두에서 의미가 있으나, 공통 유전정보를 포함하는 Kolmogorov 쪽이 유용하다고 본다.
On biology
- DNA의 1%만이 실제로 단백질로 변환되는 엑손이며, 나머지는 조절 기능 또는 미지의 기능을 갖는다.
- 전사와 번역, 스플라이싱 등 복잡한 과정을 통해 단백질이 생성된다.
- 다양한 RNA와 유전자 조절 요소들이 상호작용하며, DNA는 단순한 코드 이상이다.
On messiness
- DNA는 복잡하고 혼란스러운 구조를 가지고 있으며, 이는 돌연변이와 진화의 결과다.
- 많은 DNA가 반복되거나 비활성 상태이며, 전이인자와 돌연변이 복구 기작이 이를 설명한다.
- 생물은 오류에 강인하게 설계되어 있으며, 진화는 비효율조차 활용하는 방식으로 작동해왔다.
On information again
- “표현형 Kolmogorov 복잡도”를 제안하며, 인간으로 기능할 수 있는 최소 DNA 압축 크기를 정보량으로 본다.
- 이는 기능적으로 동일한 인간을 생성할 수 있는 가장 짧은 DNA로 측정하는 방법이다.
- 대략 60MB~750MB로 추정되지만, 이는 현재로선 명확히 알 수 없는 값이다.