# Curriculum-guided multimodal representation learning enables generalizable prediction of nanomaterial-protein interactions

### 저자

Hengjie Yu, Kenneth A. Dawson, Haiyun Yang, Shuya Liu, Yan Yan, Yaochu Jin

### 💡 개요

본 연구는 나노물질-단백질 상호작용(NPI) 예측의 일반화 성능 문제를 해결하기 위해 'CuMMI'라는 커리큘럼 기반 다중모드 표현 학습 모델을 제안합니다. 인간 혈장을 중심으로 점진적으로 다양한 생체 유체로 확장되는 다단계 학습 커리큘럼을 통해 데이터 커버리지와 일반화 능력을 향상시켰습니다. 단백질 서열, 구조, 실험적 맥락 등 다양한 정보를 통합하고 샘플 품질 가중치를 적용하여, 외부 검증을 통해 나노물질 및 단백질에 대한 강력한 일반화 성능을 입증했습니다.

### 🔑 시사점 및 한계

- 나노물질-단백질 상호작용 예측에서 일반화 성능을 크게 향상시킬 수 있는 새로운 학습 방법론을 제시합니다.

- 다양한 정보 소스를 통합하고 체계적인 학습 커리큘럼을 적용함으로써 모델의 신뢰성과 적용 범위를 넓혔습니다.

- 외부 검증 및 전이 학습 성능을 통해 모델의 실용성과 효율성을 입증했으며, 이는 향후 나노물질 연구 및 응용 가속화에 기여할 수 있습니다.

- 학습된 특징 중 가장 영향력 있는 요소들을 밝혀내어 예측 메커니즘에 대한 이해를 높였지만, 모든 종류의 생체 유체 및 나노물질에 대한 포괄적인 적용에는 추가적인 연구가 필요할 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2507.14245)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
