# MARCH: Evaluating the Intersection of Ambiguity Interpretation and Multi-hop Inference

### 저자

Jeonghyun Park, Ingeol Baek, Seunghyun Yoon, Haeun Jang, Aparna Garimella, Akriti Jain, Nedim Lipka, Hwanhee Lee

### 💡 개요

본 논문은 실제 다단계 질의응답(Multi-hop QA)에서 발생하는 복잡한 모호성 문제를 해결하기 위한 새로운 벤치마크인 MARCH를 제안합니다. MARCH는 다수의 LLM 검증과 사람의 주석을 통해 구축된 2,209개의 다단계 모호성 질문을 포함하며, 기존 최신 모델들이 이 벤치마크에서 어려움을 겪음을 보여줍니다. 이에 대한 해결책으로, 모호성 계획과 증거 기반 추론을 분리하는 2단계 에이전트 프레임워크인 CLARION을 제안하며, 이는 기존 접근 방식보다 훨씬 뛰어난 성능을 보입니다.

### 🔑 시사점 및 한계

- 실제 다단계 질의응답에서 모호성 해결과 다단계 추론의 상호작용은 중요한 연구 과제입니다.

- MARCH 벤치마크는 이러한 복잡한 상호작용을 평가하고 연구를 촉진하는 데 기여할 것입니다.

- CLARION 프레임워크는 모호성 계획과 추론 단계를 분리하여 다단계 모호성 문제 해결에 효과적인 접근 방식을 제시합니다.

- 현재 연구는 2,209개의 질문으로 구성되어 있어, 더 다양한 유형의 모호성과 추론 경로를 포괄하는 대규모 벤치마크 구축이 필요합니다.

---

[PDF 보기](https://arxiv.org/pdf/2509.22750)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
