ARR-MEDIC CYP3A4?

  • 간에서 임상 처방 약물의 절반 이상을 대사하는 핵심 효소 CYP3A4의 억제 여부를 예측해 약물 간 상호작용 위험을 가늠하는 프로젝트.
  • 연구·교육 목적의 오픈소스로 공개되었고, 손쉽게 써볼 수 있는 웹 데모와 확장 가능한 ML 파이프라인을 제공베이스라인은 약 70% 정확도로, 개념 학습과 방법론 비교의 출발점이 되도록 설계

왜 만들었나?

  • 2025년 6월 말 신약개발 AI 경진대회 있었음. 3주간 전혀 모르던 의학 분야, 특히 CYP3A4효소 논문 닥치는데로 읽으며 밤새가며 개발 완료.
  • 그러나 정작 해외거주자여서 출품조차 하지 못함. 허탈한 마음에 방치하다가 아깝다는 생각에 보완, 강화시켜 오픈소스 올림

왜 주목해야 할까?

  • 환자 안전 & 폴리파머시: CYP3A4 억제는 특정 약물 농도를 2–10배까지 높일 수 있어 독성/치료 실패로 이어질 수 있음. 이 프로젝트는 그 위험 신호를 조기에 짚어보는 연습장 역할을 함.
  • 브리지 역할: 오픈소스에서 시작해 RDKit·클래식 ML→GNN/Transformer로 단계적으로 고도화하는 로드맵을 제시.

무엇이 들어 있나? (하이라이트)

  • 웹 데모: 브라우저에서 바로 예측을 체험(한국어/영어 UI 토글, SMILES 입력·시각화, 예제 화합물 포함).
  • API & 백엔드: FastAPI 기반 REST API(단일/배치 예측, OpenAPI 문서), 비동기 SQLite 저장, Docker 지원.
  • 확장성: RDKit 서술자, RandomForest/XGBoost 같은 모델 추가, 피처 중요도 분석 등으로 손쉽게 커스터마이징.
  • 아키텍처: backend(FastAPI) / frontend(React) / models / data / docs 구성.

빠르게 써보기

  • 로컬/Conda/Docker 중 원하는 방식으로 실행 가능(uvicorn으로 API 스타트, docker-compose up -d 등). 시작 후 http://localhost:8000/docs에서 스펙 확인.
  • *온라인 데모(Hugging Face Spaces)도 제공되어 설치 없이 체험할 수 있음.

🚀 간단설치

Linux/macOS

# Clone repository  
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource  
cd arr-medic-cyp3a4-opensource  
  
# Run automated installer  
chmod +x scripts/install.sh  
./scripts/install.sh  

Windows

# Clone repository  
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource  
cd arr-medic-cyp3a4-opensource  
  
# Run automated installer  
scripts\install.bat  
  • Conda + RDKit (best accuracy)
  • pip only (simplified mode)
  • Docker (containerized)

성능 & 스펙 (교육/연구용 지표)

  • 정확도: ChEMBL 기반 CYP3A4 테스트 데이터에서 ~70%, 민감도 ~75%, 특이도 ~65% (교육·벤치마크 출발선).
  • 시스템: 단일 CPU에서도 1건 <2초 예측, 배치 처리·동시 사용자 대응 등 경량화 지향.

로드맵

  • v1.0(현재): 규칙 기반 베이스라인(~70%).
  • v2.0: RDKit + RandomForest/XGBoost로 ~80–85% 목표.
  • v3.0: GNN/Transformer로 ~85–90% 지향, 해석 가능성(예: SHAP) 강화.

라이선스 & 주의

  • MIT 라이선스. GitHub
  • 의료·진단 용도 아님: 본 프로젝트는 연구·교육 목적이며, 임상 의사결정·환자 진료·규제 제출에 사용하면 안 됨.

링크


한줄 요약

  • 실전 임상용 도구는 아니지만, DDI 예측의 ‘개념→실험→고도화’ 흐름을 한 자리에서 익히기 좋은, 잘 정리된 의료 교육·연구용 코드