기존의 기초 모델들은 다양한 하위 작업에 대한 미세 조정에 필요한 훈련 자원(예: 시간, 에너지, 레이블이 지정된 샘플)을 줄이기 위해 광범위한 데이터 세트로 사전 훈련됩니다. 그러나 기존의 기초 모델은 분포 외 예측에 어려움을 겪고 비현실적이고 물리적으로 불가능한 출력을 생성할 수 있습니다. 본 논문에서는 광범위하거나 일반적인 도메인(예: 과학) 물리적 지식을 다양한 하위 작업에 적용할 수 있도록 통합된 기초 모델인 물리학 기반 기초 모델(PGFM)의 개념을 제안합니다.
시사점, 한계점
•
시사점: 다양한 하위 작업에 대한 미세 조정에 필요한 훈련 자원을 줄일 수 있는 새로운 기초 모델 아키텍처를 제시합니다. 물리적으로 타당하고 현실적인 출력을 생성하여 기존 모델의 한계를 극복할 수 있습니다.
•
한계점: PGFM의 효과적인 구현 및 평가를 위한 구체적인 방법론과 실험적 결과가 제시되지 않았습니다. 광범위한 도메인에 적용 가능한 일반적인 물리적 지식을 어떻게 효과적으로 모델링하고 통합할지에 대한 자세한 설명이 부족합니다. 특정 물리적 법칙이나 원리의 적용에 대한 한계와 제약이 명확하지 않습니다.