본 논문은 GPT-5, Grok 4와 같은 최첨단 모델에서도 해결되지 않은 과제인 최소한의 예시로부터 구조화된 변환 규칙을 추론하는 문제를 다룹니다. 특히, 인공 일반 지능을 위한 추상 및 추론 코퍼스(ARC-AGI)를 활용하여 시각적 추상화와 언어적 추론의 상호 보완적인 역할을 밝히고, Vision-Language Synergy Reasoning (VLSR)과 Modality-Switch Self-Correction (MSSC) 전략을 통해 성능 향상을 이끌어냅니다.
시사점, 한계점
•
시사점:
◦
시각적 추상화와 언어적 추론의 통합이 일반화된 인공지능 개발에 중요함을 시사합니다.
◦
VLSR과 MSSC 전략을 통해 ARC-AGI 문제 해결에 있어 텍스트 기반 접근 방식보다 우수한 성능을 보였습니다.