본 논문은 오픈 도메인 질의응답(ODQA)에서 기존의 retriever-reader 파이프라인의 다중 라운드 프롬프트 및 높은 계산 비용, 불안정성, 최적이 아닌 검색 범위 문제점을 해결하기 위해 임베딩 수준 프레임워크인 EmbQA를 제안합니다. EmbQA는 비지도 대조 학습 목표 하에 경량 선형 계층을 통해 질의 표현을 개선하여 정답이 포함될 가능성이 높은 구절을 강조하고, 잠재 의미 공간을 확장하여 후보 생성을 다양화하고 엔트로피 기반 선택 메커니즘을 사용하여 가장 자신 있는 답변을 자동으로 선택하는 탐색적 임베딩을 도입합니다. 세 개의 오픈 소스 LLM, 세 개의 검색 방법, 네 개의 ODQA 벤치마크에 대한 광범위한 실험을 통해 EmbQA가 정확성과 효율성 모두에서 최근 기준 모델을 상당히 능가함을 보여줍니다.