GN⁺: 개방적이고 엄격하며 재현 가능한 연구: 실무자를 위한 핸드북 (2021)
(stanforddatascience.github.io)연구 설계 단계
- 연구 질문 정의
- 연구 설계 선택
- 다양한 연구 설계 인식
- 추정에서 발생하는 오류/불확실성의 다른 원인 인식
- 다양한 데이터 소스 및 연구 설계에서의 전형적인 편향
- 다양한 유형의 오류 감소 및 추정 방법
- 분석 계획 생성
- 대규모 연구 문서화 시작
분석 단계
- 여기서 시작
- 통계 분석 계획 (SAP)
- 데이터 생성
- 데이터 준비
- 데이터 시각화
- 데이터 요약
- 데이터 분석
- 의학 분야 데이터 분석
- 통계 분석 보고서
- 예시
- 자료
출판 단계
- 데이터 공개
- 코드 공개
- 재현 가능한 환경
- 오픈 출판 모델
- 프로세스 및 결정 문서화
- 추가 자료
서문
- 연구의 혜택을 증가시키기 위해 할 수 있는 많은 일이 있음을 전제로 시작함.
- 접근성이 제한되거나, 분석의 복잡성, 데이터 또는 소프트웨어의 접근성 문제 등으로 인해 연구가 투명하고 재현 가능한 방식으로 수행되지 않을 때의 주요 제한 사항들을 고려함.
- 연구를 더 개방적이고 투명하며 재현 가능하게 만들기 위한 노력이 부족한 이유들을 설명함.
저자 및 감사의 글
- 저자들은 스탠포드 대학교와 구글 헬스에서 연구 활동을 하고 있으며, 각각 기계 학습, 역학 및 인구 건강, 데이터 과학 분야에서 박사 학위를 받았음.
- 초기 독자들과 스탠포드 데이터 사이언스 이니셔티브 커뮤니티, Russ Poldrack, John Chambers, Steve Goodman에게 감사를 표함.
GN⁺의 의견
이 글에서 가장 중요한 것은 연구를 더 개방적이고 투명하며 재현 가능하게 만드는 방법을 제시하는 것이며, 이는 과학적 발견의 신뢰성을 높이고 연구 결과의 활용도를 증진시킬 수 있기 때문에 흥미롭다. 연구 설계, 데이터 분석, 출판의 각 단계에서 실용적이고 모듈화된 접근 방식을 제공함으로써, 바쁜 과학자들이 연구를 더 잘 수행하고 공유할 수 있도록 돕는다는 점에서 매력적이다.