1P by neo with xguru 2023-09-21 | favorite | 댓글과 토론
  • 모든 질병의 기본 구성 요소인 단백질의 이해 및 생성은 새로운 약물 및 치료법으로 이어질 수 있음
  • 현재 실험실에서 단백질을 설계하는 과정은 단백질 구조와 아미노산 순서를 생성하는 것을 포함하여 계산 및 자원이 많이 필요함
  • EvoDiff는 대상 단백질에 대한 구조 정보가 필요 없이 주어진 단백질 순서에서 고품질, 다양한 단백질을 생성하여 이 과정을 단순화함
  • 오픈소스 EvoDiff는 새로운 치료법, 약물 전달 방법, 산업용 화학 반응을 위한 효소를 생성하는 데 사용될 수 있음
  • '단백질 순서가 모든 것이다'라는 원칙에 따라 작동하여, 단백질 공학에서 구조-기능 패러다임에서 벗어나 새로운 단백질을 설계함
  • EvoDiff 프레임워크는 OpenFold 데이터셋과 UniRef50에서 가져온 다양한 종과 단백질 기능 클래스의 데이터에 대해 훈련된 6억 4천만 매개변수 모델을 기반으로 함
  • 현대 이미지 생성 모델과 유사한 확산 모델로, 거의 모두 노이즈로 이루어진 시작 단백질에서 점차 노이즈를 제거하고 단백질 순서에 가깝게 이동하는 방법을 학습함
  • 새로운 단백질을 생성하고 기존 단백질 설계의 공백을 채우며, 특정 기능적 목표를 충족시킴
  • 단백질의 구조가 아닌 순서 공간에서 단백질을 설계하여, 생물학과 질병에서 중요한 역할을 하는 무질서한 단백질을 합성할 수 있게 함
  • 대한 연구는 아직 동료 평가를 받지 않았으며, 프레임워크가 상업적으로 사용될 수 있기 전에 더 많은 확장 작업이 필요함
  • EvoDiff 팀은 모델이 생성한 단백질을 실험실에서 테스트하여 생존 가능성을 판단할 계획이며, 성공적이라면 프레임워크의 다음 세대 작업을 시작할 것임