Chai-1 소개: 생명 분자의 상호작용 해독
-
Chai-1 출시
- Chai-1은 약물 발견에 관련된 다양한 작업에서 최첨단 성능을 발휘하는 새로운 다중 모드 기반 모델임
- 단백질, 소분자, DNA, RNA, 공유 결합 수정 등을 통합 예측 가능
- 웹 인터페이스를 통해 무료로 제공되며, 상업적 용도로도 사용 가능
- 비상업적 용도로는 모델 가중치와 추론 코드를 소프트웨어 라이브러리로 제공
생체 분자 상호작용을 위한 최첨단 모델
-
성능 평가
- PoseBusters 벤치마크에서 77% 성공률 달성 (AlphaFold3는 76%)
- CASP15 단백질 단량체 구조 예측 세트에서 Cα LDDT 0.849 달성 (ESM3-98B는 0.801)
- 다중 서열 정렬(MSA)을 필요로 하지 않으며, 단일 서열 모드에서도 높은 성능 유지
- 다중체 구조 예측에서 AlphaFold-Multimer 모델보다 더 정확한 예측률 (69.8% vs. 67.7%)
- 단일 서열만으로 AlphaFold-Multimer 수준의 품질로 다중체 구조 예측 가능
네이티브 다중 모드 기반 모델
-
추가 데이터 활용
- 실험실에서 유래한 제한 조건 등 새로운 데이터로 성능 향상 가능
- 항체-항원 구조 예측 정확도를 두 배로 높이는 에피토프 조건화 등 다양한 기능 탐구
모델 공개
-
무료 웹 인터페이스 제공
- 상업적 용도로도 사용 가능
- 비상업적 용도로는 소프트웨어 라이브러리로 코드 공개
- 연구 및 산업 커뮤니티와의 협력을 통해 생태계 전체에 이익 제공
다음 단계
-
팀 배경
- OpenAI, Meta FAIR, Stripe, Google X 등 선도적인 연구 및 응용 AI 회사 출신
- AI를 활용한 생물학 연구의 발전에 중요한 역할 수행
- Chai-1은 몇 달간의 집중 작업의 결과이며, 이제 시작 단계
- 생물학을 과학에서 공학으로 변환하는 것이 목표
- 생화학 분자 간의 상호작용을 예측하고 재프로그래밍하는 AI 기반 모델 추가 개발 예정
GN⁺의 정리
- Chai-1은 약물 발견과 생명 과학 연구에 중요한 도구로, 단백질, 소분자, DNA, RNA 등의 구조 예측에서 최첨단 성능을 발휘함
- 다중 서열 정렬 없이도 높은 성능을 유지하며, 다중체 구조 예측에서도 우수한 성능을 보임
- 연구 및 산업 커뮤니티와의 협력을 통해 생태계 전체에 이익을 제공하며, 무료로 사용할 수 있는 웹 인터페이스와 비상업적 용도의 소프트웨어 라이브러리를 제공함
- 생물학을 공학으로 변환하는 것을 목표로, 생화학 분자 간의 상호작용을 예측하고 재프로그래밍하는 AI 모델을 추가로 개발할 예정임