# When Is Enough Not Enough? Illusory Completion in Search Agents

### 저자

Dayoon Ko, Jihyuk Kim, Sohyeon Kim, Haeju Park, Dahyun Lee, Gunhee Kim, Moontae Lee, Kyungjae Lee

### 💡 개요

본 연구는 다중 제약 조건 문제에서 검색 에이전트가 모든 요구 사항을 충족하는지 여부를 평가하는 데 초점을 맞춥니다. 기존 검색 에이전트는 제약 조건이 해결되지 않거나 위반되었음에도 불구하고 작업이 완료되었다고 잘못 판단하는 '착각적 완료' 현상을 자주 보입니다. 이를 진단하기 위해 저자들은 각 제약 조건에 대한 증거 지원과 에이전트의 믿음을 추적하는 'Epistemic Ledger'라는 평가 프레임워크를 제안합니다.

### 🔑 시사점 및 한계

- 검색 에이전트는 다중 제약 조건 문제에서 자주 '착각적 완료'를 보여 제약 조건을 놓치거나 위반하는 경향이 있습니다.

- Epistemic Ledger는 bare assertions, overlooked refutations, stagnation, premature exit와 같은 네 가지 주요 실패 패턴을 식별하여 문제 진단에 기여합니다.

- 추론 시점에 명시적인 제약 조건 상태 추적을 도입하는 LiveLedger는 검색 에이전트의 성능을 유의미하게 향상시키고 잘못 검증된 답변을 감소시키는 효과적인 해결책을 제시합니다.

---

[PDF 보기](https://arxiv.org/pdf/2602.07549)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
