# Data.gov 아카이브 공개 : 미국 연방 공공 데이터 16TB 규모의 30만개 데이터셋 포함

> Clean Markdown view of GeekNews topic #19198. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=19198](https://news.hada.io/topic?id=19198)
- GeekNews Markdown: [https://news.hada.io/topic/19198.md](https://news.hada.io/topic/19198.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2025-02-13T09:46:02+09:00
- Updated: 2025-02-13T09:46:02+09:00
- Original source: [lil.law.harvard.edu](https://lil.law.harvard.edu/blog/2025/02/06/announcing-data-gov-archive/)
- Points: 21
- Comments: 1

## Summary

하버드 로스쿨 혁신 연구소는 Source Cooperative와 협력하여 16TB 규모의 311,000개 이상의 미국 연방 공공 데이터셋을 포함한 `Data.gov` 아카이브를 공개했습니다. 이 아카이브는 학술 연구, 정책 결정, 공공 사용을 위한 중요한 데이터셋을 보존하고 인증하기 위한 "Data Vault 프로젝트"의 일환으로, 매일 업데이트됩니다. 또한, GitHub 저장소를 통해 오픈 소스 도구와 문서를 제공하여 데이터 보존 및 접근성을 누구나 확장할 수 있도록 지원합니다.

## Topic Body

- 하버드 로스쿨 혁신 연구소가 Source Cooperative에 Data.gov 아카이브를 공개  
  - Source.coop은 조직과 개인이 표준 HTTP 방법을 사용하여 데이터를 공유할 수 있는 데이터 게시 유틸리티  
- 2024~2025년 동안 수집된 미국 연방 공공 데이터셋으로 16TB 규모, 311,000개 이상의 데이터셋 포함   
- Data.gov에 새로운 데이터셋이 추가될 때마다 매일 업데이트될 예정   
- 학술 연구, 정책 결정, 공공 사용을 위한 중요한 공공 데이터셋을 보존하고 인증하기 위한 "Data Vault 프로젝트"의 첫 번째 릴리스  
  - 정부 기록 보존과 공공 정보 접근성을 높이기 위한 오랜 노력의 일환으로 구축됨  
- **도서관의 역할 강화**  
  - 정부 기록 보존 및 공공 정보 접근성 향상  
  - 세부 메타데이터 보존과 디지털 서명 설정을 통해 연구자와 대중이 필요한 정보를 쉽게 인용하고 접근할 수 있도록 함  
- **[GitHub 저장소](https://github.com/harvard-lil/data-vault)** 에서 오픈 소스 도구 및 문서 제공  
  - 유사한 저장소 구축 가능  
  - **데이터 보존 및 접근성을 누구나 확장할 수 있도록 지원**  
- 관련 프로젝트 및 지원  
  - [Perma.cc](https://perma.cc/): **법원, 법률 저널, 로펌에서 사용하는 웹 아카이빙 도구**  
  - [Caselaw Access Project](https://case.law/): **미국 판례 데이터 공개 프로젝트**  
  - [Century Scale Storage](https://lil.law.harvard.edu/century-scale-storage/): **장기 디지털 보존 연구**  
  - **Filecoin Foundation for the Decentralized Web**, **Rockefeller Brothers Fund**의 지원으로 운영됨

## Comments



### Comment 34488

- Author: botplaysdice
- Created: 2025-02-13T10:00:07+09:00
- Points: 5

이 얘기의 배경이, 지금 트럼프 정부 들어서 공공데이터에서 기록들이 삭제되고 있어서 이런 행동과 뉴스가 나온것 같습니다. 기후변화, 공공의료 관련된 기록들을 삭제하고 있다더군요. 전 세계가 살짝 미쳐 돌아가고 있는듯.  
  
https://www.404media.co/archivists-work-to-identify-and-save-the-thousands-of-datasets-disappearing-from-data-gov/
