본 논문은 펩타이드 약물 개발의 어려움 중 하나인 낮은 세포막 투과성 문제를 해결하기 위해, 펩타이드의 길이에 따른 계층적 모델링을 통해 logD (logarithm of the partition coefficient)를 정확하게 예측하는 LengthLogD 프레임워크를 제시합니다. LengthLogD는 원자, 구조, 위상 세 가지 수준의 다중 스케일 분자 표현을 통합하고, 특히 긴 펩타이드에 대한 적응적 가중치 할당 메커니즘을 사용하여 다층 앙상블 학습을 통해 최적화된 모델을 구축합니다. 실험 결과, 짧은, 중간, 긴 펩타이드 모두에서 기존 단일 모델 접근 방식에 비해 예측 오류를 크게 줄이고, 특히 긴 펩타이드의 경우 R^2 값을 25.7% 향상시켰음을 보여줍니다. 이는 긴 펩타이드 약물 후보 물질 최적화에 중요한 도구를 제공합니다.