GN⁺: 자가면역질환 발견을 위한 오픈 소스 AI 도구 개발
(old.reddit.com)- 자가 면역 질환을 찾기 위해 오픈 소스 AI 도구를 구축한 방법(10만 달러와 30회 이상의 병원 방문 후) - 이제 누구나 사용할 수 있음
오픈 소스 건강 분석 도구 개발 이야기
5년간의 건강 문제와 진단 과정
- 운동 중 쉽게 부상을 입고, 회복이 느리며, 피로감과 관절통을 겪음
- 30곳 이상의 병원과 전문의를 방문하고 $100,000 이상 지출했으나 명확한 진단을 받지 못함
- 여러 의료 전문가들이 각자의 분야만 보고 전체적인 연결 고리를 찾지 못함
- 결국 류마티스 전문의가 유전자 검사와 증상을 종합적으로 분석한 후 자가면역 질환 가능성을 발견함
AI가 같은 진단을 제시한 경험
- 의료 데이터를 정리해 GPT 모델에 입력했더니 최종 진단과 동일한 결과를 제안함
- 이를 계기로 비슷한 문제를 겪는 사람들을 위해 AI 기반 의료 데이터 분석 도구를 개발하기로 결심함
오픈 소스 프로젝트 소개: OpenHealth
GitHub 링크: OpenHealth
주요 기능
- 의료 기록 업로드: PDF, 검사 결과, 의사 소견서 등을 업로드 가능
-
자동 분석 및 정리:
- 다양한 형식의 검사 결과를 표준화
- 단위 변환 (예: mg/dL → mmol/L)
- CRP, ESR, CBC, 비타민 수치 등 주요 지표 추출
- 검사 결과를 시간 순으로 정리
-
AI를 활용한 데이터 분석:
- 검사 수치 변화를 추적
- 여러 병원의 검사 결과를 비교
- 여러 검사 데이터를 종합적으로 분석하여 패턴 식별
-
다양한 AI 모델과 연동 가능:
- 로컬 모델(Deepseek 등) 사용 가능
- GPT-4, Claude 등 API 키가 있으면 상업용 모델도 활용 가능
의료 기록 가져오기
- 병원 기록이 파일로 없을 경우 Fasten Health 활용 가능
- 미국 대부분의 의료 기관과 연동 가능
- 의료 기록을 한 곳에서 쉽게 관리할 수 있도록 지원
현재 개발 상태
- 프론트엔드는 완성 및 오픈 소스 공개됨
- 문서 분석 기능은 별도 Python 서버에서 동작 중
- 향후 완전 로컬 실행이 가능하도록 마이그레이션할 예정
AI와 건강 관련 커뮤니티
- AI가 개인 건강 관리에 어떻게 기여할 수 있는지 논의하는 커뮤니티 생성: r/AIDoctor
- AI의 한계를 인정하면서도, 더 나은 의료 분석 도구로 발전할 가능성을 탐색 중
안녕하세요! OpenHealth 프로젝트를 개발하고 있습니다. 평소 긱뉴스에서 다른 분들의 프로젝트를 보다가 제가 만든 프로젝트가 올라와서 감회가 새롭네요.
한국은 의료 데이터 접근성이 좋아서 LLM과 연동하기 좋은 환경입니다. 국민건강보험과 건강보험심사평가원에서 의료기록을 조회할 수 있고, 상세 진료기록은 병원에 사본 발급을 요청하면 받을 수 있습니다.
관련 내용은 프로젝트 이슈에도 추가해두었습니다 (https://github.com/OpenHealthForAll/open-health/issues/36). 저도 이런 방식으로 제 데이터를 활용해보니 큰 도움이 되고 있습니다.
의료 서비스는 환자의 데이터가 많을 수록, 의학지식이 많을 수록, 분석하는 지능이 높을수록 서비스 품질이 좋아진다고 생각합니다. AI는 빠르게 발전하기 때문에, AI 기반 의료서비스가 품질과 비용 면에서 더 좋아질 수밖에 없다고 생각합니다.
다만 현재는 규제나 사업모델 등 때문에 이런 서비스들을 쉽게 찾아보기 어렵습니다. 그래서 제가 경험한 가치를 다른 분들과 나누고자 오픈소스로 이 프로젝트를 시작하게 되었습니다.
관심 있으신 분들은 연락 주세요! openhealthforall@gmail.com
Hacker News 의견
-
놀라움. 의료 분야에서 질문을 계속할 수 있고, 과부하된 의사가 처리할 수 있는 것보다 더 많은 데이터를 제공할 수 있을 때 가능한 일이 대단함. 친구의 아버지가 중병에 걸렸을 때 ChatGPT를 사용하여 암 보고서를 해석하고, 여러 전문가와 깊이 있는 기술적 대화를 나누며 아버지를 위한 치료를 옹호할 수 있었음. 이는 전문가들이 생각하지 못했던 치료를 옹호하는 데 결정적이었음. 친구는 전문가들과 그들의 언어로 대화하고, ChatGPT를 통해 아버지에게 비전문적인 설명을 제공할 수 있었음. 이는 엄청난 권한 부여임
-
AI를 무시하는 사람들에게: 문제가 있다는 것을 알고 있지만, 도움을 받아야 할 전문가들로부터 어깨를 으쓱하는 반응만 받는 기분을 모름. 나도 같은 경험을 했음. 정형외과 의사는 관절과 손목 통증을 살펴보고, 내분비학자는 호르몬을 검사하고, 류마티스 전문의는 자체 테스트를 진행했음. 주치의에게 의존했다면, 나는 이부프로펜과 그들의 선호하는 대형 제약사의 항염증제를 복용하고 있었을 것임. 온라인에서 다른 사람들과 대화하고 주치의에게 HLA-B27 항원에 대해 테스트를 요청함으로써 강직성 척추염을 발견할 수 있었음. 인터넷에서 "왜 X를 확인하지 않습니까?"라는 도움을 받은 것은 운이 좋았음. 나처럼 운이 좋지 않거나 정보에 접근할 수 없는 다른 사람들을 상상해봄. AI가 이 문제를 도울 수 있다면, 그것은 훌륭함
-
이 문제에 대해 갈등을 느끼고 있음. 한편으로는, 아무도 미국의 의료 시스템이 좋거나 적절하다고 진지하게 주장할 수 없음. 이 과정은 기술 지원을 탐색하는 것과 비슷하며, 초기 단계는 가장 일반적인 사례의 신속한 분류와 (간신히) 적절한 해결을 지향함. 이는 개인이 더 많은 능력을 갖추지 못했다는 것을 의미하지 않음. 단지 시스템이 그렇게 설정되어 있지 않음. 'L2' 지원에 도달하는 것은 기술 세계에서만큼이나 좌절감을 줄 수 있음. 다른 한편으로는, 도메인 특정 데이터를 해석하는 데 많은 훈련과 경험이 필요함. 로그를 보는 것과 약간 비슷하게, 무시할 것을 아는 것이 종종 더 중요함. LLM은 여러 가능한 원인을 덤프할 수 있으며, 그 중 일부는 아마도 환각일 수 있음. 그러나 결과를 가지고 다음 단계로 나아가는 것은 대부분의 사람들이 할 수 있는 일이 아님. 이러한 도구의 가장 즉각적인 이점은 아마도 충분한 시간과 지식을 얻어 효과적으로 사용할 수 있는 동기와 결단력을 가진 개인에게 있을 것임. 확실한 것은, 이 스레드에서 다른 사람들이 지적한 것처럼, 의료 시스템에서 자신의 옹호자가 되어야 한다는 것임
-
사람들이 자신의 (익명화된) 의료 기록을 중앙 데이터베이스에 업로드하여 추가적인 통찰력을 얻어 치료를 안내할 수 있다면 멋질 것임. 인종이나 국가 출신과 같은 유전 정보를 포함하면, 사람들은 장애의 유전학에 대해 배울 수 있을 것임. 나는 마르판 증후군으로 나타나는 결합 조직 장애를 가지고 있지만, 2010년대에 UCSF의 유전학자를 방문했음. 그는 마르판, 로이스-디츠, 루잔-프린스, 엘러스-단로스 및 내 신체 증상, 심혈관 문제 및 골격 문제를 설명할 수 있는 다른 여러 장애를 살펴보았지만, 아무것도 찾지 못했음
-
$100K 30번의 의사 방문, 답이 없었음. 이는 아마도 Ehlers Danlos Syndrome (hEDS)와 관련이 있을 수 있음. 오늘날 내 증상을 AI에 입력하면, 의사에게 제공한 것과 같은 목록을 얻을 수 있으며, hEDS와 TNXB를 후보 유전자로 얻음. 내 WGS DNA 데이터는 의사에게 더 이상 신경 쓰지 않게 된 후에 나왔음. AFAIK, hEDS를 진단하는 것은 전문가만 가능하며, AFAIK, TNXB를 예측하는 사람은 전혀 없음. 그들은 그것을 clEDS라고 부르며, 특정 TNXB SNP가 동형 접합일 때만 100만 중 1로 간주함. 나는 대부분의 hEDS가 무해한 것으로 추정되는 TNXB SNP에 의해 발생한다고 생각함. 심지어 hEDS의 DNA 후보를 찾는 연구에서도 TNXB를 건너뛰는데, 이는 hEDS가 드물고 TNXB SNP가 일반적이라는 믿음 때문임. AI가 어디서 정보를 얻는지 모르겠지만, TNXB 이론은 주로 그것을 가진 일부 환자들이 가진 이론임. RCCX 유전자 클러스터에 초점을 맞춘 일부 특이한 재능 연구자들이 있음. 이는 많은 자가면역 질환을 유발함. AI의 답변이 의사보다 훨씬 낫다고 생각함. AI가 틀렸다고 해도, 모든 의사가 틀렸던 것보다 나쁘지 않음. 한 의사는 나에게 갑상선 수술을 받아야 한다고 말했지만, 그 단계에서 이미 그들에 대한 신뢰를 잃었음
-
가장 좌절스러운 부분은 답변의 부족뿐만 아니라 모든 것이 조각나 있다는 것이었음. 각 의사는 퍼즐의 한 조각만 보았음: 정형외과 의사는 관절 통증을 살펴보고, 내분비학자는 호르몬을 검사하고, 류마티스 전문의는 자체 테스트를 진행했음. 아무도 전체 그림을 보지 않았음. 류마티스 전문의를 방문하여 내 증상과 유전자 검사 결과의 조합을 살펴본 후에야 자가면역 질환이 있을 가능성이 있다는 것을 알게 되었음
-
이걸 의심하는 사람은 정말로 무슨 말을 하는지 모름. Claude(또는 다른 것)에 "건강 및 피트니스" 프로젝트를 설정하고 다음을 입력함: 기본 데이터: 키, 몸무게, 나이, 성별. Apple Health 또는 기타에서 기본 메트릭 스냅샷: HRV 범위, RHR, 일반적인 수면 구조 - 모든 것을 살펴보고 요약함. 일반적인 식단 (MFP 또는 Cronometer에서 추적합니까? 훌륭함, 영양 보고서를 업로드함). 복용하는 보충제 및 약물. 일반적인 운동 습관. 보유한 건강 기록 - 혈액 검사 결과, 해석된 이미지 결과 등. 의사에게 설명할 것처럼 가족력. 건강 불만 요약. 관련된 것처럼 보이는 다른 모든 것. 그런 다음 몇 가지 대화 루프를 통해 더 유용하게 만들기 위해 제공할 수 있는 추가 정보가 있는지 묻습니다. 그런 다음 "주어진 <건강 불만>에 대해 더 해야 할 것? 덜 해야 할 것?" 또는 "잠재적 원인에 대해 추측해 주세요"와 같은 질문을 함. 특정 건강 불만이 없더라도 "오늘 시작하거나 중단해야 할 보충제 하나는 무엇입니까?"와 같은 질문을 할 수 있음 (그리고 후속 연구를 당연히 수행함). 이는 삶을 변화시킴. 이를 의심하는 사람은 시도해보지 않았음
-
RAG + 건강 데이터 분석은 엄청난 잠재력을 가짐. 당연히 조심해야 하지만, 나도 개인 건강 데이터에 RAG를 사용했음. 의사들이 머리를 긁적일 때 매우 유용했음. 내 경우에는 병원에서 호흡/식사 문제로 입원한 내 아기였음. mychart의 네트워크 탭에서 데이터를 가져와 추가 컨텍스트를 추가한 다음 Claude에게 질문했음. 내 주요 목표는 아침 회진에 대비하는 것이었음. 각 테스트가 나에게 어떤 종류의 정보를 제공할 것인지 이해하고 싶었음. 꽤 좋았음. 놀랍지 않게도, 때때로 환각하거나 일부 뉘앙스를 놓쳤음. 그러나 나는 그것이 그런 일을 한다는 것을 알고 있었음. 오류가 있어도 나에게 도움이 되었음. 그러나 "이 모든 것을 고려할 때 내 아기에게 무슨 일이 일어나고 있는지"라고 말하려고 하지는 않았음. 다른 주제에 대해: 내가 당신이라면, 이 것을 FHIR 또는 다른 일반 형식으로 말하게 만들 것임. 그렇게 하면 다른 도구 생태계에서 이 것을 사용하는 것이 훨씬 쉬워질 것임. FHIR graphql API를 위에 추가할 수도 있음
-
재미있게도, 이는 데이터 누출과 AI가 주요하고 가치 있는 작업을 해결할 수 있다는 잘못된 (또는 극도로 추론된) 주장에 대한 거의 전형적인 예임. 두 가지 매우 관련된 관찰이 필요함. 1. 의료 시스템의 상태, 이것이 미국이라면, 치료는 분류에 기반하고 있으며, 더 깊은 분석이나 전문가에게 접근하기 위해 여러 가지 장애물을 거쳐야 함. 이는 비용을 절감하면서 죽지 않도록 보장하기 위한 것임. 2. 의사 방문에서 데이터를 사용하고 입력하고 있음, 이는 AI가 반드시 대체할 수 있는 방식으로 진단을 제공하지 않는다는 것을 의미함. 많은 방문이 흐름 차트 결정 규칙을 통해 가능성을 배제/포함하는 데 도움이 될 것임. AI가 의사의 명령으로만 사용할 수 있는 데이터에 의존하는 것을 AI 열광과 산업 논문에서 많이 볼 수 있음. 이는 가치 기반 치료가 진단하기 어려운 상태를 가진 사람들에게 더 나은 경험과 결과를 제공할 것임을 보여줌
-
이는 아마도 다음과 같이 표현되어야 함: 왜 의료진이 $100k와 30번의 병원 방문 후에 내 자가면역 질환을 발견하지 못했는가?