본 논문은 인간의 지각에 대한 분자적 이해 접근 방식의 설명적 측면에 초점을 맞춘 기존 연구들의 한계를 지적하며, 분자 개념과 특정 구조적 구성 요소를 연결하는 참조적(referential) 측면을 중점적으로 다룹니다. 이를 위해, 모델의 참조 능력을 평가하기 위한 분자 기반(grounding) 벤치마크를 제안하고, NLP, 화학 정보학, 분자 과학 분야의 기존 관례와의 정합성을 보여줍니다. 79,000개의 QA 쌍으로 구성된, 현재까지 가장 큰 분자 이해 벤치마크를 구축하고, 개념 증명으로 다중 에이전트 기반 모델을 개발하여 기존 모델(GPT-4o 포함)을 능가하는 성능을 보였습니다. 또한, 분자 캡션 생성 및 ATC 분류와 같은 기존 작업을 향상시키기 위해 기반 모델의 출력을 통합했습니다.