OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery
Created by
Haebom
Category
Empty
저자
Vignesh Prabhakar, Md Amirul Islam, Adam Atanas, Yao-Ting Wang, Joah Han, Aastha Jhunjhunwala, Rucha Apte, Robert Clark, Kang Xu, Zihan Wang, Kai Liu
개요
본 논문은 과학 분야의 복잡한 문제 해결을 위해 특화된 대규모 추론 모델인 OmniScience를 소개한다. OmniScience는 세 가지 주요 구성 요소, 즉 (1) 엄선된 과학 문헌 코퍼스를 사용한 도메인 적응적 사전 훈련, (2) 도메인 특정 작업 수행을 위한 지침 미세 조정, (3) 문맥적으로 관련되고 논리적으로 타당한 응답 생성 능력을 크게 향상시키기 위한 추론 기반 지식 증류를 통해 개발되었다. 배터리 에이전트를 개발하여 전해질 용매 또는 첨가제로서의 분자를 효율적으로 순위 매기는 OmniScience의 다용성을 보여준다. 포괄적인 평가 결과, OmniScience는 GPQA Diamond 및 도메인 특정 배터리 벤치마크에서 최첨단 대규모 추론 모델과 경쟁력을 갖추고 있으며, 유사한 매개변수 수를 가진 모든 공개 추론 및 비추론 모델을 능가하는 것으로 나타났다. 또한, ablation 실험을 통해 도메인 적응적 사전 훈련과 추론 기반 지식 증류가 벤치마크 전반에서 성능 수준을 달성하는 데 중요함을 보여준다.