본 논문은 금융 분야에서 지식 집약적 작업에 탁월한 성능을 보이는 RAG(Retrieval-augmented generation) 기반 LLM의 한계점을 해결하기 위해 HiREC(Hierarchical Retrieval with Evidence Curation) 프레임워크를 제안합니다. 기존 RAG 방식은 유사한 형식의 표준화된 문서(예: SEC 공시)에서 반복되는 틀과 유사한 표 구조로 인해 중복된 검색 결과를 생성하는 문제점을 가지는데, HiREC는 계층적 검색을 통해 유사한 텍스트 간의 혼동을 줄이고, 증거 관리 과정을 통해 무관한 부분을 제거하며, 필요에 따라 추가 정보를 수집하기 위한 보완 질문을 자동 생성합니다. 또한, 145,897개의 SEC 문서와 1,595개의 질문-답변 쌍으로 구성된 대규모 개방형 금융 질의응답 벤치마크인 LOFin을 구축하여 공개합니다.