Sign In

A Generalist Cross-Domain Molecular Learning Framework for Structure-Based Drug Discovery

Created by
  • Haebom
Category
Empty

저자

Yiheng Zhu, Mingyang Li, Junlong Liu, Kun Fu, Jiansheng Wu, Qiuyi Li, Mingze Yin, Jieping Ye, Jian Wu, Zheng Wang

개요

본 논문은 구조 기반 약물 발견(SBDD)을 위해 다양한 생화학적 실체(소분자, 단백질, 단백질-리간드 복합체 등)와 2D 및 3D 구조 데이터를 처리할 수 있는 범용 기초 모델인 BIT(Biomolecular Interaction Transformer)를 제안한다. BIT는 다양한 생화학 도메인의 생체 분자를 처리하기 위한 Mixture-of-Domain-Experts (MoDE)와 분자 구조의 위치 의존성을 포착하기 위한 Mixture-of-Structure-Experts (MoSE)를 도입하여 미세한 분자 상호 작용을 효과적으로 포착한다. 여러 통합된 자기 지도 학습 기반의 잡음 제거 작업을 통해 공유 트랜스포머 백본에서 교차 도메인 사전 학습을 수행한다. 결과적으로, 다양한 벤치마크에서 결합 친화도 예측, 구조 기반 가상 스크리닝, 분자 특성 예측 등의 하위 작업에서 뛰어난 성능을 달성함을 보여준다.

시사점, 한계점

시사점:
기존의 단백질 또는 소분자에만 초점을 맞춘 사전 학습 모델의 한계를 극복하고, 단백질-리간드 상호 작용을 효과적으로 고려하는 새로운 모델을 제시.
MoDE와 MoSE를 통해 다양한 생체 분자와 구조 데이터를 통합적으로 처리하고, 미세한 분자 상호 작용을 효과적으로 학습.
결합 친화도 예측, 구조 기반 가상 스크리닝, 분자 특성 예측 등 다양한 SBDD 관련 작업에서 우수한 성능을 입증.
SBDD 분야의 효율성 및 정확성 향상에 기여할 가능성 제시.
한계점:
본 논문에서 제시된 모델의 일반화 성능 및 확장성에 대한 추가적인 검증 필요.
다양한 종류의 생체 분자 및 구조 데이터에 대한 포괄적인 평가가 필요하며, 특정 데이터셋에 대한 편향성 여부 확인 필요.
실제 약물 개발 과정에 적용하기 위한 추가적인 연구 및 검증이 필요.
계산 비용 및 시간에 대한 고려가 필요.
👍