Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning

Created by
  • Haebom

저자

Linger Deng, Linghao Zhu, Yuliang Liu, Yu Wang, Qunyi Xie, Jingjing Wu, Gang Zhang, Yingying Zhu, Xiang Bai

개요

대규모 다중모드 모델(LMM)은 충분하지 않은 사고의 연쇄(CoT) 이미지-텍스트 훈련 데이터로 인해 기하학적 추론에 제한이 있습니다. 기존 접근 방식은 기하학적 CoT 데이터 생성을 위해 템플릿 기반 또는 LLM 지원 방법을 활용하지만 다양성과 정확성을 모두 달성하는 데 어려움을 겪습니다. 이러한 간극을 해소하기 위해 본 논문에서는 두 단계의 정리 검증 역 사고의 연쇄 추론 합성(TR-CoT) 프레임워크를 제시합니다. 첫 번째 단계인 TR-Engine은 구조화된 설명과 속성을 사용하여 정리 기반 기하학적 다이어그램을 합성합니다. 두 번째 단계인 TR-Reasoner는 역 추론을 사용하여 기하학적 속성과 설명 조각을 상호 검증하여 질문-답변 쌍을 반복적으로 개선합니다. 본 연구의 접근 방식은 정리 유형 적용 범위를 확장하고 오랫동안 존재해 온 오해를 수정하며 기하학적 추론을 향상시킵니다. 세분화된 CoT는 정리 이해를 향상시키고 논리적 일관성을 24.5% 증가시킵니다. 최고 성능 모델은 MathVista와 GeoQA에서 기준 모델보다 각각 10.1%와 4.7% 높은 성능을 보이며, GPT-4o와 같은 고급 비공개 모델보다 우수한 성능을 나타냅니다.

시사점, 한계점

시사점:
정리 기반 기하학적 다이어그램과 구조화된 설명 및 속성을 합성하는 TR-Engine을 통해 기하학적 CoT 데이터의 다양성과 정확성을 향상시켰습니다.
역 추론을 활용한 TR-Reasoner를 통해 질문-답변 쌍을 반복적으로 개선하고 기하학적 추론의 논리적 일관성을 높였습니다.
세분화된 CoT를 통해 정리 이해도와 논리적 일관성을 24.5% 향상시켰습니다.
MathVista와 GeoQA에서 기존 최고 성능 모델을 능가하는 성능을 달성했습니다.
GPT-4o와 같은 고급 비공개 모델보다 우수한 성능을 보였습니다.
한계점:
본 논문에서 제시된 TR-CoT 프레임워크의 일반화 성능 및 다양한 기하학 문제에 대한 적용 가능성에 대한 추가적인 연구가 필요합니다.
TR-Engine의 정리 적용 범위 확장 및 TR-Reasoner의 추론 효율 향상에 대한 연구가 지속적으로 필요합니다.
👍