본 논문은 대규모 언어 모델(LLM)과 검색 메커니즘을 통합하여 문맥상 정확한 답변을 생성하는 효과적인 패러다임인 검색 증강 생성(RAG)의 한계점을 다룹니다. 특히 법률 분야에서 사용자들이 법 조항을 내용이 아닌, (예: 헌법 제5조 또는 소비자 방어법(CDC)) 라벨이나 별칭으로 참조하는 경우가 빈번하며, 이는 텍스트의 의미적 임베딩에만 의존하는 기존 RAG 접근 방식에 어려움을 야기합니다. 본 논문은 각 법 조항에 여러 개의 구별된 임베딩을 할당하는 다중 벡터 검색(Poly-Vector Retrieval) 방법을 제시합니다. 하나의 임베딩은 내용(전체 텍스트)을, 다른 하나는 라벨(식별자 또는 고유 명칭)을, 선택적으로 추가 임베딩은 다른 명칭을 포착합니다. 브라질 연방 헌법에 대한 실험을 통해 다중 벡터 검색이 라벨 중심 쿼리에 대한 검색 정확도를 크게 향상시키고 내부 및 외부 상호 참조를 해결할 잠재력을 가지면서 순수하게 의미론적인 쿼리에 대한 성능 저하 없이 작동함을 보여줍니다. 임베딩에서 참조와 내용을 명시적으로 분리하는 것의 철학적, 실용적 의미를 논의하고, 이 접근 방식을 더 광범위한 법률 데이터 세트 및 명시적 참조 식별자가 특징인 다른 도메인에 적용하기 위한 미래 연구 방향을 제시합니다.