본 논문은 대규모 언어 모델(LLM)의 화학 및 생물 공학(CBE) 분야, 특히 이온 액체(ILs)를 이용한 탄소 격리 연구에 대한 활용 가능성을 평가하기 위해, 전문가가 엄선한 5,920개의 예시로 구성된 새로운 벤치마킹 데이터셋을 제시합니다. 이 데이터셋은 언어적 지식과 도메인 특화 지식의 난이도를 다양하게 조정하여 LLM의 추론 능력을 평가하며, 100억 파라미터 미만의 오픈소스 LLM 3종을 대상으로 실험을 진행합니다. 그 결과, 소규모의 범용 LLM은 ILs에 대한 지식은 갖고 있지만, 도메인 특화 추론 능력은 부족하다는 것을 보여줍니다. 나아가, ILs를 이용한 탄소 포집 연구에 LLM을 활용하기 위한 고려 사항을 논의하며, LLM의 높은 탄소 발자국을 고려했을 때 IL 연구에 활용하는 것이 상호 시너지 효과를 창출하고 2050년 탄소 중립 목표 달성에 기여할 수 있음을 시사합니다. 데이터셋은 GitHub에서 공개됩니다.