Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning
Created by
Haebom
저자
Linger Deng, Linghao Zhu, Yuliang Liu, Yu Wang, Qunyi Xie, Jingjing Wu, Gang Zhang, Yingying Zhu, Xiang Bai
개요
대규모 다중모드 모델(LMM)은 충분하지 않은 사고 과정(CoT) 이미지-텍스트 훈련 데이터로 인해 기하학적 추론에 제한이 있습니다. 기존의 접근 방식은 기하학적 CoT 데이터 생성을 위해 템플릿 기반 또는 LLM 지원 방법을 활용하지만, 다양성과 정확성을 모두 달성하는 데 어려움을 겪습니다. 이러한 간극을 해소하기 위해, 본 논문에서는 두 단계의 정리 검증 역 사고 과정 추론 합성(TR-CoT) 프레임워크를 제시합니다. 첫 번째 단계인 TR-Engine은 구조화된 설명과 속성을 갖춘 정리 기반 기하학적 다이어그램을 합성합니다. 두 번째 단계인 TR-Reasoner는 역 추론을 사용하여 기하학적 속성과 설명 조각을 교차 검증함으로써 질문-답변 쌍을 반복적으로 개선합니다. 본 연구의 접근 방식은 정리 유형 적용 범위를 확장하고, 오랫동안 존재해 온 오해를 바로잡고, 기하학적 추론을 향상시킵니다. 세분화된 CoT는 정리 이해도를 높이고 논리적 일관성을 24.5% 향상시킵니다. 본 논문의 최고 성능 모델은 MathVista와 GeoQA에서 기준 모델보다 각각 10.1%와 4.7% 앞서며, GPT-4o와 같은 고급 비공개 모델을 능가합니다.
시사점, 한계점
•
시사점:
◦
정리 기반 기하학적 다이어그램 생성 및 역 추론을 통한 CoT 데이터 생성의 새로운 프레임워크 제시
◦
기존의 템플릿 기반 또는 LLM 지원 방법의 한계점을 극복하고 다양성과 정확성을 모두 향상
◦
정리 이해도 향상 및 논리적 일관성 증대 (24.5% 향상)
◦
MathVista와 GeoQA에서 기존 최고 성능 모델들을 능가하는 성능 달성 (10.1% 및 4.7% 향상)
◦
고급 비공개 모델인 GPT-4o를 능가하는 성능 달성
•
한계점:
◦
TR-CoT 프레임워크의 일반화 성능 및 다른 유형의 추론 문제에 대한 적용 가능성에 대한 추가 연구 필요