Show GN: ARR-MEDIC CYP3A4: 약물 상호작용(DDI) 예측을 위한 오픈소스 교육·연구 플랫폼
(github.com/Flamehaven)ARR-MEDIC CYP3A4?
- 간에서 임상 처방 약물의 절반 이상을 대사하는 핵심 효소 CYP3A4의 억제 여부를 예측해 약물 간 상호작용 위험을 가늠하는 프로젝트.
- 연구·교육 목적의 오픈소스로 공개되었고, 손쉽게 써볼 수 있는 웹 데모와 확장 가능한 ML 파이프라인을 제공베이스라인은 약 70% 정확도로, 개념 학습과 방법론 비교의 출발점이 되도록 설계
왜 만들었나?
- 2025년 6월 말 신약개발 AI 경진대회 있었음. 3주간 전혀 모르던 의학 분야, 특히 CYP3A4효소 논문 닥치는데로 읽으며 밤새가며 개발 완료.
- 그러나 정작 해외거주자여서 출품조차 하지 못함. 허탈한 마음에 방치하다가 아깝다는 생각에 보완, 강화시켜 오픈소스 올림
왜 주목해야 할까?
- 환자 안전 & 폴리파머시: CYP3A4 억제는 특정 약물 농도를 2–10배까지 높일 수 있어 독성/치료 실패로 이어질 수 있음. 이 프로젝트는 그 위험 신호를 조기에 짚어보는 연습장 역할을 함.
- 브리지 역할: 오픈소스에서 시작해 RDKit·클래식 ML→GNN/Transformer로 단계적으로 고도화하는 로드맵을 제시.
무엇이 들어 있나? (하이라이트)
- 웹 데모: 브라우저에서 바로 예측을 체험(한국어/영어 UI 토글, SMILES 입력·시각화, 예제 화합물 포함).
- API & 백엔드: FastAPI 기반 REST API(단일/배치 예측, OpenAPI 문서), 비동기 SQLite 저장, Docker 지원.
- 확장성: RDKit 서술자, RandomForest/XGBoost 같은 모델 추가, 피처 중요도 분석 등으로 손쉽게 커스터마이징.
-
아키텍처:
backend(FastAPI)
/frontend(React)
/models
/data
/docs
구성.
빠르게 써보기
-
로컬/Conda/Docker 중 원하는 방식으로 실행 가능(uvicorn으로 API 스타트,
docker-compose up -d
등). 시작 후http://localhost:8000/docs
에서 스펙 확인. - *온라인 데모(Hugging Face Spaces)도 제공되어 설치 없이 체험할 수 있음.
🚀 간단설치
Linux/macOS
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
chmod +x scripts/install.sh
./scripts/install.sh
Windows
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
scripts\install.bat
- Conda + RDKit (best accuracy)
- pip only (simplified mode)
- Docker (containerized)
성능 & 스펙 (교육/연구용 지표)
- 정확도: ChEMBL 기반 CYP3A4 테스트 데이터에서 ~70%, 민감도 ~75%, 특이도 ~65% (교육·벤치마크 출발선).
- 시스템: 단일 CPU에서도 1건 <2초 예측, 배치 처리·동시 사용자 대응 등 경량화 지향.
로드맵
- v1.0(현재): 규칙 기반 베이스라인(~70%).
- v2.0: RDKit + RandomForest/XGBoost로 ~80–85% 목표.
- v3.0: GNN/Transformer로 ~85–90% 지향, 해석 가능성(예: SHAP) 강화.
라이선스 & 주의
- MIT 라이선스. GitHub
- 의료·진단 용도 아님: 본 프로젝트는 연구·교육 목적이며, 임상 의사결정·환자 진료·규제 제출에 사용하면 안 됨.
링크
- GitHub: Flamehaven/Arr-Medic-CYP3A4
- 온라인 데모: Hugging Face Spaces (빠른 데모 실행가능)
- 못다 한 개발 이야기: My First Attempt at a Medical AI with ELI5(의료 전문가가 아님에도 만들 수 있었던 과정을 담음)
한줄 요약
- 실전 임상용 도구는 아니지만, DDI 예측의 ‘개념→실험→고도화’ 흐름을 한 자리에서 익히기 좋은, 잘 정리된 의료 교육·연구용 코드